[发明专利]一种基于大数据的人口迁移分析方法和系统有效
申请号: | 201910172651.1 | 申请日: | 2019-03-07 |
公开(公告)号: | CN110046174B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 陈茜 | 申请(专利权)人: | 特斯联(北京)科技有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/28;G06F16/29;G06Q50/00 |
代理公司: | 11619 北京辰权知识产权代理有限公司 | 代理人: | 刘广达 |
地址: | 100027 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人口迁移 大数据 人口聚集 社交网站 签到信息 人口管理 仓库 关联规则算法 出发位置 时间顺序 分析 时间段 反推 构建 描点 申请 叠加 住址 地理位置 推算 人口 挖掘 移动 统计 | ||
1.一种基于大数据的人口迁移分析方法,其特征在于,包括:
通过社交网站公开API函数获取社交网站中带有地理位置签到信息的发帖,采用规则匹配算法提取出所述签到信息中的地址信息,结合地理信息系统推算出所述地址信息的地理坐标,对发帖签到时间进行时间规范化填充,将所述发帖、所述地址信息、所述地理坐标、所述发帖签到时间导入数据仓库,构建人口迁移基础大数据仓库;
基于所述人口迁移基础大数据仓库中的数据,以时间为单位,将社交网站中每个用户的签到信息进行描点,并进行统计叠加,得到各时间段人口聚集热点;
从所述人口聚集热点按照人口移动时间顺序进行位置反推,得出每个用户的初始出发位置,运用关联规则算法推算出各人口聚集热点人口住址规律;
所述以时间为单位,将社交网站中每个用户的签到信息进行描点,并进行统计叠加,包括:
测算每小时各兴趣点的签到数量,结合在该兴趣点签到的每个用户的属性进行加权叠加,得到每个兴趣点的热度指数。
2.根据权利要求1所述的方法,其特征在于,构建人口迁移基础大数据仓库,包括:
设置分布式数据节点,采用间歇式随机访问算法访问所述社交网站公开API,并行抽取发帖数据后,剔除语义与空间位置不一致的噪声点,经过去重、清洗、规范化后,存入大数据仓库中。
3.根据权利要求1所述的方法,其特征在于,所述结合地理信息系统数据推算出所述地址信息的地理坐标,包括:
通过模拟人工点击方法,获取所述签到信息的兴趣点,通过地理信息系统查询得到兴趣点的经纬度坐标及标准地址。
4.根据权利要求1所述的方法,其特征在于,所述统计叠加包括:
通过公式
H=∑∑ωi·Pj
计算所述兴趣点的热度指数,其中Pj为第j个签到用户属性的量化值,ωi为签到用户的第i个属性的加权系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联(北京)科技有限公司,未经特斯联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910172651.1/1.html,转载请声明来源钻瓜专利网。