[发明专利]基于DPI数据的用户地理位置特征提取方法及系统有效

专利信息
申请号: 201810256044.9 申请日: 2018-03-27
公开(公告)号: CN108520028B 公开(公告)日: 2021-05-07
发明(设计)人: 欧中洪;谭言信;宋美娜;宋俊德 申请(专利权)人: 北京邮电大学
主分类号: G06F16/29 分类号: G06F16/29;G06Q10/04
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 张润
地址: 100876 北京市海淀区西*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 dpi 数据 用户 地理位置 特征 提取 方法 系统
【权利要求书】:

1.一种基于DPI数据的用户地理位置特征提取方法,其特征在于,包括以下步骤:

根据用户ID从DPI数据库中获取多条目标用户数据;

通过移动运营商基站信息库查询每条目标用户数据中的Cell-ID对应的基站,以获取所述每条目标用户数据的经纬度信息;

对所述经纬度信息进行空值处理、异常值处理、设置地理范围阈值和提取URL定位信息,以得到预处理数据;具体包括:处理空值,在缺失经纬度、用户ID信息的一条或多条信息时,删除该条经纬度信息,并在缺失URL信息时,用NAN值填充URL信息;设立地理范围阈值,根据所述经纬度信息检测结果删除超出范围信息或异常信息;通过正则表达式从URL中提取定位信息;

根据预设驻留范围距离阈值、预设驻留范围最短时间阈值和比较序列对所述预处理数据进行筛选处理,以得到出行数据集;进一步包括:设定预设驻留范围距离阈值、预设驻留范围最短时间阈值,并清空比较序列;将下一条数据放入比较序列中,并按照数据产生时间顺序将余下数据与比较序列中的每条数据依次进行比较,如果数据的位置与所述比较序列任意一条数据的位置距离未超过预设驻留范围距离阈值,则继续进行比较;如果数据的位置与所述比较序列任意一条数据的位置距离超过预设驻留范围距离阈值,则计算所述比较序列中最后一条数据与第一条数据的时间差,如果时间差值大于预设驻留范围最短时间阈值,则将所述比较序列中数据标记为驻留数据,如果时间差值小于预设驻留范围最短时间阈值,则释放所述比较序列中的数据项;如果还有未遍历的数据项,则继续进行比较,如果遍历完成,则根据结果将相邻两个驻留区域间的数据标记为出行数据,以得到所述出行数据集;

根据所述出行数据集提取得到出行路径特征,其中,所述出行路径特征包括始发地、目的地、时间、路径和出行方式中的一种或多种;

根据地图平台API参数和所述出行路径特征得到候选路径集,并根据API响应结果从所述候选路径集提取得到候选路径特征;

将所述候选路径特征与运动路径特征进行匹配,并使用评分机制对匹配结果进行评分,以得到评分最高的预测路径;以及

通过预设距离阈值对出行序列和所述预测路径的时间进行匹配,以更新当前地理位置信息。

2.根据权利要求1所述的基于DPI数据的用户地理位置特征提取方法,其特征在于,所述候选路径特征集包括每一候选路径的出行方式、每一候选路径的总耗时、候选路径中每一段的时间集、坐标集、出行方式一种或多种。

3.根据权利要求1所述的基于DPI数据的用户地理位置特征提取方法,其特征在于,所述通过预设距离阈值对出行序列和所述预测路径的时间进行匹配,以更新当前地理位置信息,进一步包括:

设置距离阈值,对出行序列和所述预测路径的时间进行匹配;

如果出行序列的原始位置与对应时间内的预测路径的位置距离小于所述距离阈值,则更新当前地理位置信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810256044.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top