[发明专利]社交网络去匿名方法、装置、计算机设备和存储介质有效
申请号: | 202010742424.0 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111882449B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 赵晓娟;王培;常春喜;陈恺;王昌海;马锶霞;李晨晨 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F21/62;G06N3/08;G06N3/04 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 周达 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 匿名 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种社交网络去匿名方法、装置、计算机设备和存储介质。所述方法包括:对预先获取的社交网络进行匿名处理,得到匿名网络;采用随机游走策略,获取匿名网络中预设步数的用户节点序列,根据用户节点序列,构建用户语料库;利用预先设置的词向量模型对用户语料库中的用户进行嵌入,得到用户节点向量;获取预先设置的辅助网络,根据辅助网络中用户节点和匿名网络中用户节点,构建种子节点对;将种子节点对对应的向量对输入预先设置的全连接神经网络,得到训练好的全连接神经网络;将匿名网络中待预测的用户节点向量输入训练好的全连接神经网络,输出所述辅助网络中去匿名的匹配结果。采用本方法能够对匿名处理效果进行检测。
技术领域
本申请涉及图数据处理技术领域,特别是涉及一种社交网络去匿名方法、装置、计算机设备和存储介质。
背景技术
社交网络时刻产生海量的数据,这些数据中蕴含着无数的应用价值。数据挖掘技术是在这种背景下出现和发展的。随着数据挖掘技术的发展,数据挖掘给各个领域带了巨大的价值,包括商业领域,工程领域,医药领域等诸多领域。
伴随社交网络数据挖掘而来的是用户的隐私问题。一份调查显示,网上用户随时面临着财产信息、身份信息、出行信息泄露的风险,同时还会受到软件病毒的威胁,而且,威胁程度与日俱增。社交网络俨然已经成为黑客的巨大目标。社交网络数据可以抽象为图结构数据,图中的节点代表社交网络的用户,边代表社交网络用户之间的关系,对社交网络结构的研究可以抽象为对图结构的研究,类似的结构还有WIFI,蓝牙,即时消息等。数据发布中隐私保护主要针对的是用户的敏感数据、人物身份以及人物关系,现有的手段一般包括删除标志符,K匿名,差分隐私等手段。所有匿名数据都需要通过去匿名技术的检测,去匿名技术可以检测匿名效果,同时逆向提高匿名技术,促进匿名技术的发展,更好的保护用户的隐私。
发明内容
基于此,有必要针对上述技术问题,提供一种社交网络去匿名方法、装置、计算机设备和存储介质。
一种社交网络去匿名方法,所述方法包括:
对预先获取的社交网络进行匿名处理,得到匿名网络;
采用随机游走策略,获取所述匿名网络中预设步数的用户节点序列,根据所述用户节点序列,构建用户语料库;
利用预先设置的词向量模型对所述用户语料库中的用户进行嵌入,得到用户节点向量;
获取预先设置的辅助网络,根据所述辅助网络中用户节点和所述匿名网络中用户节点,构建种子节点对;
将所述种子节点对对应的向量对输入预先设置的全连接神经网络,得到训练好的全连接神经网络;
将匿名网络中待预测的用户节点向量输入训练好的全连接神经网络,输出所述辅助网络中去匿名的匹配结果。
在其中一个实施例中,还包括:获取社交网络中的连边信息;根据预先设置的噪声率,删除所述社交网络中的n%条边,得到剩余连边集合;随机添加n%条边,得到新增连边集合;根据所述剩余连边集合和所述新增连边集合,得到匿名网络。
在其中一个实施例中,还包括:随机生成一条检测边,当所述检测边不在剩余连边集合和所述新增连边集合中时,将所述检测边加入所述新增连边集合;以及,删除所述新增连边集合中与所述剩余连边集合相同的边。
在其中一个实施例中,还包括:对所述用户语料库中的用户节点序列进行one-hot编码,得到N维向量;利用N维向量训练预先设置的Skip-Gram模型,得到训练好的Skip-Gram模型;通过训练好的Skip-Gram模型输出用户节点向量。
在其中一个实施例中,还包括:设置损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010742424.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于业务驱动的数据交互装置
- 下一篇:一种3D打印机成型平台及3D打印机