[发明专利]相似轨迹计算方法、装置及电子设备有效
申请号: | 202010782921.3 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112040414B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 徐鹏飞 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | H04W4/029 | 分类号: | H04W4/029;H04W4/20;G06F16/29;G06F18/22 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似 轨迹 计算方法 装置 电子设备 | ||
公开一种相似轨迹计算方法、装置、电子设备及机器可读存储介质。在本申请中,从对接的信令库中获取指定目标时段内的所有信令,生成待搜索信令集合;基于预设时间窗对所述搜索信令集合中的各条信令执行数据加工,生成与各个用户分别对应的信令轨迹,并基于生成的信令轨迹构建信令轨迹集合;对所述信令轨迹集合执行多级筛选计算,确定出与目标用户的第一信令轨迹相似的其它用户的第二信令轨迹,极大地减少了相似轨迹计算所需的信令数量及信令轨迹数量,从而提高了相似轨迹的计算效率。
技术领域
本申请一个或多个实施例涉及计算机应用技术领域,尤其涉及相似轨迹计算方法、装置、电子设备及机器可读存储介质。
背景技术
通信运营商拥有海量的用户,每个用户每天在使用移动终端的过程中,频繁地通过信令与运营商的基站进行交互,产生了更加海量的信令。通常,在一个城市的运营商拥有的用户数量可以达到数百万乃至千万级,则每日产生的信令可以达到数十亿级别。这些信令可以有助于运营商对用户进行更为深入的分析,形成一些信令轨迹,为政府公共安全部门等机构提供一些有价值的数据支撑。然而由于信令的数据量过于庞大,缺乏有效的处理机制,无法实现用户信令轨迹的价值最大化。
发明内容
本申请提供一种相似轨迹计算方法,所述方法包括:
从对接的信令库中,获取指定目标时段内的所有信令,生成待搜索信令集合;
基于预设时间窗对所述搜索信令集合中的各条信令执行数据加工,生成与各个用户分别对应的信令轨迹,并基于生成的信令轨迹构建信令轨迹集合;
对所述信令轨迹集合执行多级筛选计算,确定出与目标用户的第一信令轨迹相似的其它用户的第二信令轨迹。
可选的,所述信令至少包括用户标识、上报时刻、终端位置;所述用户标识用于唯一标识用户身份,所述终端位置表征用户携带的终端所在的地理位置,所述上报时刻表征所述终端上报所述终端位置时对应的时刻。
可选的,所述时间窗为预设时间周期被分割为若干长度相同且被顺序编号的时间段;
所述基于预设时间窗对所述搜索信令集合中的各条信令执行数据加工,生成与各个用户分别对应的信令轨迹,包括:
基于信令中的用户标识,将所述搜索信令集合中的信令按用户分组,得到与各个用户分别对应的分组信令;
基于信令中的上报时刻,将各个用户分别对应的分组信令基于时间窗进行对齐映射,得到与各个用户分别对应的时间窗对齐映射后的若干信令;
将与各个用户分别对应的时间窗对齐映射后的若干信令中的每个信令的终端位置按时间窗编号顺序串接,生成与各个用户分别对应的终端位置序列;
基于生成与各个用户分别对应的终端位置序列,生成与各个用户分别对应的信令轨迹。
可选的,当同一时间窗对应存在同一用户标识的多个信令时,还包括:
计算该多个信令中的终端位置对应的中心点位置,并将该中心点位置作为该同一用户标识的多个信令对应在该同一时间窗的终端位置。
可选的,所述基于生成与各个用户分别对应的终端位置序列,生成与各个用户分别对应的信令轨迹,包括:
将与各个用户分别对应的终端位置序列中的每个终端位置,分别生成对应的哈希位置;
基于生成的哈希位置,构建与各个用户分别对应的哈希位置序列,将与各个用户分别对应的哈希位置序列作为与各个用户分别对应的信令轨迹。
可选的,所述哈希位置为GeoHash位置;
所述对所述信令轨迹集合执行多级筛选计算,确定出与目标用户的第一信令轨迹相似的其它用户的第二信令轨迹,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010782921.3/2.html,转载请声明来源钻瓜专利网。