[发明专利]基于信令CDR数据识别伴随手机号码的方法与系统有效
申请号: | 202010085049.7 | 申请日: | 2020-02-10 |
公开(公告)号: | CN111294742B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 陈泽江;司俊俊;羊晋;涂波 | 申请(专利权)人: | 邑客得(上海)信息技术有限公司 |
主分类号: | H04W4/20 | 分类号: | H04W4/20 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 200082 上海市虹口*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cdr 数据 识别 伴随 手机号码 方法 系统 | ||
1.一种基于现有的信令CDR数据识别伴随手机号码的方法,对筛选出的手机号码进行CDR日志提取,按日志时间排序形成手机号码轨迹数据;手机号码轨迹数据为将手机号码经过的基站映射成为的geohash方格序列;通过调整geohash方格序列的大小,调整手机号码轨迹的容错性,并通过累计一段时间的轨迹数据实现伴随手机号码的识别;包括以下步骤:
第1步,采集手机信令数据,解析成CDR格式数据后进行存储;
第2步,选择一定时间范围的CDR格式的手机信令数据;
第3步,从第2步的手机信令CDR格式数据中筛选在目标区域基站停留的手机号码,得到目标区域的常驻手机号码;
第4步,从手机信令CDR格式数据中过滤出目标区域常驻手机号码的CDR日志,形成手机号码轨迹数据;CDR日志包含手机号码、手机通信连接的基站位置、时间;
第5步,对手机号码轨迹数据进行去噪;再将手机号码轨迹数据中日志的时间戳转换为时间点;根据CDR日志中的手机基站编号,获取基站的经纬度并转换为geohash方格,得出时空数据,包括手机号码、时间点、geohash方格;
第6步,从第5步的时空数据中提取得到手机号码列表:具体是将同一时间点经过同一个geohash方格的所有手机号码组合成手机号码列表;所述手机号码列表记录了在同一个时间点、同一个geohash方格里经过的所有手机号码;
第7步,从第5步的时空数据中提取得到geohash方格列表,具体是将同一个手机号码在一个时间点经过的多个geohash方格组合成geohash方格列表;并扩展得到的geohash方格列表,扩展后的geohash方格列表包括手机号码实际经过的geohash方格及每个geohash方格的邻居方格;所述扩展后的geohash方格列表记录了在同一个时间点、同一个手机号码经过的多个geohash方格;
第8步,对第7步得到的数据进行处理:将手机号码经过的扩展后的geohash方格列表分解,将手机号码、时间点、扩展后的geohash方格列表数据,转换为手机号码、时间点、geohash方格数据,即得到的每条数据包含一个geohash方格;
第9步,将第8步得到的每条数据关联第6步得到的手机号码列表数据,以geohash方格、时间点为关联字段,得出手机号码、时间点、geohash方格、该geohash方格对应的全部手机号码列表,即获取到一个手机号码在某时间点经过某geohash方格时,该geohash方格对应的全部手机号码列表;
第10步,将第9步得到的数据中的全部手机号码列表进行分解,得到同一个时间点同时出现在同一个geohash方格的多个手机号码;
第11步,计算第10步得到的多个手机号码当天出现在同一个geohash方格中的所有时间点的数量,称为伴随次数;
第12步,从第5步数据中,按手机号码聚合,获取每个手机号码当天出现的所有时间点集合;
第13步,将第11步得到的伴随次数数据关联第12步得到的每个手机号码当天出现的所有时间点数据,得到每一个手机号码当天出现的所有时间点以及多个手机号码当天出现在同一个geohash方格的时间点合集;
第14步,根据第13步得到的时间点合集计算得到排除次数和每天的伴随数据;
设定一个时间段为一个时间点,两个手机号码在该时间段内距离相近,则表示两个手机号码在这个时间段发生了一次伴随现象;如果两个手机号码出现在同一个时间段,但是距离较远,则表示两个手机号码发生了一次排除现象;伴随数据包括两个手机号码及其伴随次数和排除次数;
第15步,执行上述伴随数据计算过程,得到累积一定时间周期的数据;
第16步,对累积数据分别按照手机号码进行聚合,根据排除次数和伴随天数获取到不同手机号码在该时间周期内的伴随次数、伴随天数、排除次数、排除天数、每个手机号码当月出现的总天数;
第17步,对聚合后的数据执行过滤计算,排除掉排除次数远大于伴随次数的手机号码对,得到过滤数据;
第18步,对第17步的过滤数据中的每组号码执行评分运算,再对每个手机号码取评分最高的手机号码作为该手机号码的伴随手机号码;
具体通过以下公式计算进行评分,得到每组手机号码之间的得分Score:
Score=(fdts+log(fsize)-(edts/1.5)-log(esize+1))/min(fCDR,tCDR)*(1-esize/fsize)
其中,fCDR表示手机号码1出现的天数;tCDR表示手机号码2出现的天数;fsize表示一个月里的伴随次数;fdts表示一个月里伴随的天数;esize表示一个月的排除次数;edts表示一个月的排除天数;
通过上述步骤,完成基于现有的信令CDR数据识别伴随手机号码的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邑客得(上海)信息技术有限公司,未经邑客得(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010085049.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置