[发明专利]一种基于大数据挖掘的虚拟身份关联分析方法有效
申请号: | 201811490064.9 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109614420B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 王国锋;刘海滨;庄维维;朱荣亚 | 申请(专利权)人: | 南京森根科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06K9/62 |
代理公司: | 广州天河万研知识产权代理事务所(普通合伙) 44418 | 代理人: | 刘强 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于大数据挖掘的虚拟身份关联分析算法模型,属于大数据挖掘技术领域。该方法包括获取电子串号信息和物理地址信息;对源数据进行清洗处理、规则过滤;并对处理后的数据进行属性分割、特征提取、指标计算;针对样本类别不平衡问题,调整不同类别训练样本;搭建Logistic Regression算法模型,以计算手机物理地址和电子串号之间关系的匹配度,实现虚拟身份的挖掘分析和关联匹配,本发明可以通过轨迹追查,确定犯罪轨迹,对犯罪嫌疑人实施跟踪和追捕,侦破案件,最终达到对犯罪的有效控制和打击。 | ||
搜索关键词: | 一种 基于 数据 挖掘 虚拟 身份 关联 分析 方法 | ||
【主权项】:
1.一种基于大数据挖掘的虚拟身份关联分析算法模型,其特征在于,包括以下步骤:S1:电子串号及物理地址数据预处理;分别对无线数据采集终端的电子串号和物理地址的脏数据进行处理;S2:关联数据筛选及存储;将满足筛选规则的数据存储于数据库中;S3:样本特征构建及提取;对关联数据进行属性分割及结合,构建M个样本特征,并对特征数据进行降维处理,使样本变量维度变为N;S4:类别不平衡问题处理;采用Fisher判别法调整不同类别训练样本;S5:建立及优化电子串号与物理地址关联模型;根据算法建立模型,得出电子串号与物理地址的匹配度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京森根科技股份有限公司,未经南京森根科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811490064.9/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置