[发明专利]基于网络空间用户标识的有效虚拟身份刻画方法有效
申请号: | 201611101931.6 | 申请日: | 2016-12-05 |
公开(公告)号: | CN106534164B | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 彭如香;杨涛;李兰凤;何治乐;王永剑;凡友荣 | 申请(专利权)人: | 公安部第三研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 王洁;郑暄 |
地址: | 200031*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于网络空间用户标识的有效虚拟身份刻画方法,首先从无关联的http post数据提取网络虚拟账号,并利用广告联盟用户标识的唯一性将虚拟账号进行关联,然后通过虚拟账号关联分析算法,实现了虚拟身份画像原型的构建;最后采用改进的Jaccard相似系数计算算法,将相似度高的原型合并,进一步完善了画像模型。采用本发明的基于网络空间用户标识的有效虚拟身份刻画方法,目的在于克服现有技术中通过IP识别用户的不准确的缺点,提出一种有效的虚拟身份刻画方法,具有广泛的适用范围和很大的应用价值,实现了网络空间虚拟身份的有效全面刻画,为网络安全管理工作提供有效的手段。 | ||
搜索关键词: | 计算机 基于 网络 空间 用户 标识 有效 虚拟 身份 刻画 方法 | ||
【主权项】:
1.一种基于网络空间用户标识的有效虚拟身份刻画方法,其特征在于,所述的方法包括以下步骤:(1)计算机软件系统截取并存储某局域网络中某一段时间的全量数据,并在该段时间内不定期地在不同计算机上通过测试账号登录网络,访问网页;(2)所述的计算机软件系统在所述的全量数据中抽取出域名信息、对应用户ID标识的报文信息及cookie信息,并存储所述的对应用户ID标识的报文信息;(3)所述的计算机软件系统对其获取的所述的对应用户ID标识的报文信息进行格式化处理;(4)所述的计算机软件系统抽取并处理cookie中含有虚拟账号字段标识的报文,以获取报文处理数据,并将所述的报文处理数据存储于存储模块,具体为:所述的计算机软件系统抽取cookie中含有虚拟账号字段标识的报文,并按照时间、源IP、目的域名、目的网站、虚拟账号、广告联盟类型、广告联盟值分类获取相应的报文处理数据,并对所述的报文处理数据进行相应的数据存储格式转换,将所述的转换后的报文处理数据存储于该计算机软件系统中的MongoDB部分;(5)所述的计算机软件系统根据cookie信息获取合并关联组并存储,具体为:所述的计算机软件系统根据不同cookie中相同的广告联盟账号获取初始关联组,并根据同一时间、同一IP、相同的cookie中出现不同的广告联盟账号合并所述的初始关联组,以获取所述的合并关联组,并存储所述的合并关联组;(6)所述的计算机软件系统根据所述的合并关联组获取大图数据;(7)所述的计算机软件系统计算其所获取的用户虚拟身份原型的相似度,完成虚拟身份画像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部第三研究所,未经公安部第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611101931.6/,转载请声明来源钻瓜专利网。