[发明专利]一种基于聚落对象的人口空间分布预测方法在审
申请号: | 202011401637.3 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112381332A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 吴田军;董文;骆剑承 | 申请(专利权)人: | 中国科学院空天信息创新研究院;长安大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06K9/62;G06F16/29 |
代理公司: | 北京盛询知识产权代理有限公司 11901 | 代理人: | 陈巍 |
地址: | 100101 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 聚落 对象 人口 空间 分布 预测 方法 | ||
本发明提供一种基于聚落对象的人口空间分布预测方法,包括以下步骤:选取聚落对象,采集聚落对象对应的地理空间数据,并进行数据预处理,得到聚落对象的变量因子及人口密度对数;根据预处理后的变量因子及人口密度对数构建预测模型,根据回归模型得到人口密度预测值,并通过计算分解权重,得到最终的人口预测值;对最终的人口数量预测值进行精度评估,评价预测模型的预测性能,根据预测结果进行预测模型优化。本发明通过对人口普查数据进行空间化处理,通过采用改进的随机森林模型,能够得到准确、真实、地理上一致的空间分布结果。
技术领域
本发明涉及人口数据分析技术领域,特别涉及一种基于聚落对象的人口空间分布预测方法。
背景技术
人口问题是当今世界影响可持续发展的重要社会问题之一。近年来人口增长加剧了全球资源和环境的承受压力,环境、资源和人口之间的矛盾更加突出。及时掌握人口信息,明确人口空间分布及其变化规律,可以为区域可持续发展研究和规划提供科学依据。人口普查是实现各国人口信息统计分析的主要渠道,包括抽样调查和普查。统计普查虽然有严谨的统计理论和方法支持,具有权威性和规范性等优点,但仍存在数据稀缺、精度和时间分辨率低、更新周期长等缺陷,不利于可视化和空间分析。在人口分布规律研究和自然灾害应对中,难以满足精准应用的要求。一般来说,以往的研究大多遵循自上而下的方法,将行政单位的统计数据按照一定的原则进行网格尺度的分解。然而,在网格尺度下很难对人口分布的不确定性进行评估,尤其是在1km或500m的尺度上进行制图,而且在精细化程度不够的情况下,人口分布信息往往表现不佳。
机器学习在人口空间分布预测领域正在逐渐流行起来,其中随机森林训练模型通过有效挖掘隐含的非线性回归关系,证明了该算法对多变量关系分析在精确预测中的鲁棒性。但是,随机森林已经被证明在某些噪音较大的分类或回归问题上会过拟,因此目前机器学习模型在人口空间分布领域还存在诸多掣肘之处。
发明内容
本发明的目的在于提供一种基于聚落对象的人口空间分布预测方法,通过对人口普查数据进行空间化处理,通过采用改进的随机森林模型,能够得到准确、真实、地理上一致的空间分布结果。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于聚落对象的人口空间分布预测方法,其特征在于,包括以下步骤:
选取聚落对象,采集聚落对象对应的地理空间数据,并进行数据预处理,得到聚落对象的变量因子及人口密度对数;
根据预处理后的变量因子及人口密度对数构建预测模型,根据回归模型得到人口密度预测值,并通过计算分解权重,得到最终的人口预测值;
对最终的人口数量预测值进行精度评估,评价预测模型的预测性能,根据预测结果进行预测模型优化。
优选地,所述聚落对象对应的地理空间数据包括行政区域内的常住人口数、灯光数据、土地利用数据、水体道路数据及聚落分布数据。
优选地,所述预处理的过程为:将地理空间数据转换为统一投影坐标系以及参考椭球体;将行政区的常住人口数除以行政区面积得到行政区的人口密度,并根据灯光数据计算人口密度初步值;对灯光数据进行双线性的重采样获得栅格,得到灯光数据变量因子;对土地利用数据、水体道路数据的变量因子进行欧式距离计算,得到距离数据变量因子;对建筑物区域数据进行二值化栅格转换,得到二值化栅格转换后的变量因子。
优选地,所述回归模型为采用改进的CART决策树建立的随机森林回归模型。
优选地,所述人口密度预测值的计算过程为:采用多棵相互独立的CART决策树,并对决策树分别进行训练;通过训练后的决策树计算人口密度预测结果,并取预测结果的平均值作为人口密度的预测值。
优选地,所述多棵相互独立的CART决策树的个数根据所述聚落对象的变量因子的数据规模进行确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院;长安大学,未经中国科学院空天信息创新研究院;长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011401637.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理