[发明专利]一种一机多号识别方法、装置及其存储介质有效
申请号: | 202111011603.8 | 申请日: | 2021-08-31 |
公开(公告)号: | CN114297323B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 蒋志鹏;戴帅夫;刘丙双;李莉 | 申请(专利权)人: | 北京九栖科技有限责任公司;李莉 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/22;G06F16/2455;G06Q50/30;H04W4/029;H04W8/24 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 100095 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 一机多号 识别 方法 装置 及其 存储 介质 | ||
1.一种一机多号识别方法,其特征在于,包括以下步骤:
S1.将实时接入的位置数据按设备号分组,仅存储每个设备号发生位置切换时的时空信息,分别形成离线轨迹库,并从中提取预设周期内的轨迹数据;
S2.统一每条设备号轨迹中轨迹点的经纬度坐标系,并将经纬度编码为Geohash字符串,按Geohash网格汇总经纬度的停留时长,则所述轨迹数据转变为Geohash网格序列;
S3.遍历每个设备号在一个预设周期内的所述Geohash网格序列,并按出现时间顺序拼接成字符串,利用散列算法将所述字符串编码为二进制海明码,形成新的海明码集合H;
S4.构建二级哈希函数,所述二级哈希函数包括局部敏感哈希函数和标准哈希函数,通过所述局部敏感哈希函数将所述H中任一设备号的海明码映射到哈希桶,通过所述标准哈希函数以所述哈希桶的内容为索引建立哈希表;
S5.对于所述H中每个设备号,遍历所述哈希表中各所述哈希桶并分别计算海明距离,输出海明距离小于K的设备号集合为潜在一机多号集合;
S6.遍历每个所述潜在一机多号集合,利用基于金字塔匹配核的轨迹伴随模型计算各设备号与集合中其他设备号间的轨迹相似度,若相似度超过设定阈值,则判定为一机多号设备。
2.根据权利要求1所述的一种一机多号识别方法,其特征在于,S1中的所述预设周期至少为一周;所述轨迹数据包括设备号、经度、纬度和时间。
3.根据权利要求1所述的一种一机多号识别方法,其特征在于,S2中所述Geohash字符串的位数为5~7位;
所述Geohash网格序列为:
L={g|g∈{geohash(dt,t)},t2≤t≤t1}
其中geohash(dt,t)为单个设备号的全部Geohash网格,t为信令时间,t1和t2为每天任意时间段,dt为在t时刻处于该Geohash网格的停留时长。
4.根据权利要求1所述的一种一机多号识别方法,其特征在于,S3中所述预设周期至少为一周;在S3的遍历每个设备号在一个预设周期内的所述Geohash网格序列之前,依次以所述Geohash网格和轨迹点为单位,对移动速度和轨迹夹角进行合理性判定,过滤轨迹噪声数据。
5.根据权利要求2所述的一种一机多号识别方法,其特征在于,S5中所述K取为2~5。
6.根据权利要求1所述的一种一机多号识别方法,其特征在于,在S6的遍历每个所述潜在一机多号集合之前,根据画像属性对所述潜在一机多号集合进行过滤;其中所述画像属性包括:历史常驻地和设备信息所述历史常驻地:
其中使用但不限于使用至少半年前的不同月份,m’为该月的自然天数,t1’和t2’为每天固定时间段,gj*为该月累计停留时间最长的Geohash网格;
所述设备信息包括使用国际移动设备识别码。
7.根据权利要求1所述的一种一机多号识别方法,其特征在于,S6中利用基于金字塔匹配核的轨迹相似性模型计算各设备号与集合中其他设备号间的轨迹相似度:
其中,L为时间切片数,Gl为第l层时间切片下的空间切片数,且Kt,i(U1,U2)=|{(p,q)|(p,q)∈{cell(t,i)}},p∈U1,q∈U2|其中,cell(t,i)为轨迹点的碰撞时空,U1和U2分别表示两个设备号各自的轨迹;当l>0时,当l=0时,
8.根据权利要求1所述的一种一机多号识别方法,其特征在于,S6中相似度阈值至少为70%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九栖科技有限责任公司;李莉,未经北京九栖科技有限责任公司;李莉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011603.8/1.html,转载请声明来源钻瓜专利网。