[发明专利]一种一机多号识别方法、装置及其存储介质有效
申请号: | 202111011603.8 | 申请日: | 2021-08-31 |
公开(公告)号: | CN114297323B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 蒋志鹏;戴帅夫;刘丙双;李莉 | 申请(专利权)人: | 北京九栖科技有限责任公司;李莉 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/22;G06F16/2455;G06Q50/30;H04W4/029;H04W8/24 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 100095 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 一机多号 识别 方法 装置 及其 存储 介质 | ||
本发明公开了一种一机多号识别方法、装置及其存储介质,该方法首先提取设备信令轨迹数据并计算每个轨迹点的Geohash网格,基于多级滤波方法对轨迹进行去噪处理,再通过局部敏感哈希算法筛选潜在一机多号设备集合,最后融合基于金字塔匹配核的轨迹相似性模型和设备画像属性从中识别真正的一机多号设备。本发明根据日常行为模式、历史常驻地、设备信息等多维度特征识别一机多号设备,能够兼容不同运营商间基站定位差异,实现海量异网设备的高效一机多号识别。
技术领域
本发明涉及通信数据分析技术领域,更具体的说是涉及一种一机多号识别方法、装置及其存储介质。
背景技术
随着5G时代的到来,各类智能设备如雨后春笋般出现在人们日常生活当中,随之而来的是海量的异网异构位置信息,包括车载GPS数据、手机信令数据以及其他物联网卡位置数据。尽管丰富的位置信息能够更加全面地刻画用户行为模式,但这些数据往往涉及不同的信息采集单元、不同运营商、不同经纬度坐标系,对一机多号的识别提出了新的挑战。
传统的一机多号识别方法一般分为基于概率统计的方式和基于个人轨迹的方式。基于概率统计的方法以基站为对象,统计共同访问某基站的次数、时长等要素,以此评估是否为一机多卡(号)用户,该方法缺少用户的连续时空位置特征,导致精度要低于基于个人轨迹的方法。基于个人轨迹的方法又可以进一步分为同网场景(同运营商)识别和异网场景(不同运营商)识别。同网场景下直接应用轨迹相似度计算方法能够获得较高的一机多号识别准确率,但两两比对计算效率低下。异网场景实际上包含了同网场景,并且相比之下更加复杂,也将面临更多的困难,例如基站基础数据不准带来的轨迹噪音问题、异网基站距离过大导致的轨迹伴随不精确问题、用户规模及轨迹数据太大带来的计算资源不足问题等。目前利用长期轨迹伴随/排除的方法能够在一定程度上缓解上述问题,但静止状态下基站的频繁远距离切换会引发较多的误排除问题,降低一机多号识别准确率,并且尽管该方法采用分布式索引提高了计算效率,但大规模排除操作使得海量设备的一机多号识别仍需要数百小时。
因此,如何提出一种精准高效的一种一机多号识别方法、装置及其存储介质是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种一机多号识别方法、装置及其存储介质,旨在克服现有技术计算时间长、误排多的不足,进一步提高一机多号的识别精度和识别效率。
为了实现上述目的,本发明采用如下技术方案:
一种一机多号识别方法,包括以下步骤:
S1.将实时接入的位置数据按设备号分组,仅存储每个设备号发生位置切换时的时空信息,分别形成离线轨迹库,并从中提取预设周期内的轨迹数据;
S2.统一每条设备号轨迹中轨迹点的经纬度坐标系,并将经纬度编码为Geohash字符串,按Geohash网格汇总经纬度的停留时长,则所述轨迹数据转变为Geohash网格序列;
S3.遍历每个设备号在一个预设周期内的所述Geohash网格序列,并按出现时间顺序拼接成字符串,利用散列算法将所述字符串编码为二进制海明码,形成新的海明码集合H;
S4.构建二级哈希函数,所述二级哈希函数包括局部敏感哈希函数和标准哈希函数,通过所述局部敏感哈希函数将所述H中任一设备号的海明码映射到哈希桶,通过所述标准哈希函数以所述哈希桶的内容为索引建立哈希表;
S5.对于所述H中每个设备号,遍历所述哈希表中各所述哈希桶并分别计算海明距离,输出海明距离小于K的设备号集合为潜在一机多号集合;
S6.遍历每个所述潜在一机多号集合,利用基于金字塔匹配核的轨迹伴随模型计算各设备号与集合中其他设备号间的轨迹相似度,若相似度超过设定阈值,则判定为一机多号设备。
需要说明的是:
S4中所述的局部敏感哈希函数可使用但不限于Simhash函数,计算公式如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九栖科技有限责任公司;李莉,未经北京九栖科技有限责任公司;李莉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011603.8/2.html,转载请声明来源钻瓜专利网。