[发明专利]一种基于手机信令分析和提取用户移动轨迹的方法在审
申请号: | 202011237478.8 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112765120A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 何利文;赵金城 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/215;G06F16/2455;G06F16/2458;G06F16/248;G06F16/28;H04L29/08;H04W4/029;H04W4/20 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 曹坤 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手机 分析 提取 用户 移动 轨迹 方法 | ||
1.一种基于手机信令分析和提取用户移动轨迹的方法,其特征在于,具体步骤包括如下:
步骤(1.1)、首先通过Flume数据采集系统采集手机信令数据源并储存;
步骤(1.2)、针对目标历史轨迹的分析,由Flume数据采集系统将储存的历史数据进行采集并存储到HDFS分布式文件系统中;
步骤(1.3)、对存储到HDFS分布式文件系统中的历史数据进行数据清洗;
步骤(1.4)、数据清洗完成后,加载到Hive数据仓库,根据每个用户的数据通过计算分析出用户的离线历史轨迹,
步骤(1.5)、将用户的离线历史轨迹数据存储到MySQL关系数据库中,按照天进行分区,用于后续查询或加载到ES搜索引擎中便于快速检索;
步骤(1.6)、针对目标实时轨迹的分析,通过Kafka消息系统订阅实时信令数据,
步骤(1.7)、经过Storm流式计算框架对实时信令数据进行分析,记录用户的状态:即当前位置和出现时间;当获取到一条新的数据及目标位置发生变化时,则更新用户的状态信息,从而计算出用户的实时轨迹序列数据;
步骤(1.8)、将用户的实时轨迹序列数据缓存至Redis中,通过GIS地图软件按时间序列显示出用户的轨迹。
2.根据权利要求1所述的一种基于手机信令分析和提取用户移动轨迹的方法,其特征在于,在步骤(1.1)中,实时的数据源包括设备数据、系统数据集其它数据。
3.根据权利要求1所述的一种基于手机信令分析和提取用户移动轨迹的方法,其特征在于,在步骤(1.3)中,所述对存储到HDFS分布式文件系统中的历史数据进行数据清洗的具体操作步骤如下:
(1.3.1)、字段缺失数据:手机信令数据包含imsi手机串号、时间戳和基站经纬度,对缺失字段信息的记录进行删除;
(1.3.2)、漂移数据:先设置一个阈值,计算两个基站之间的距离和时间差求得用户速度,将其与阈值进行比较,若大于阈值,则说明用户未离开当前基站范围;
(1.3.3)、重复数据:根据用户手机信令经纬度重复的记录,保留时间最早和最迟共两条记录,即用户在基站信号范围内的出现时间和离开时间,其余的全部删除;
(1.3.4)、离群数据点:先使用k-means聚类算法进行预处理,滤除非离群点数据,然后使用LOF离群点检测算法在剩余的数据中检测离群点,将其删除。
4.根据权利要求1所述的一种基于手机信令分析和提取用户移动轨迹的方法,其特征在于,在步骤(1.4)中,所述的用户的历史轨迹包括imsi、基站位置、用户的出现时间及离开时间。
5.根据权利要求1所述的一种基于手机信令分析和提取用户移动轨迹的方法,其特征在于,在步骤(1.6)中,所述的Kafka消息系统是一种分布式高吞吐的消息发布订阅系统,用于保存实时数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011237478.8/1.html,转载请声明来源钻瓜专利网。