[发明专利]社交网络去匿名方法、装置、计算机设备和存储介质有效

专利信息
申请号: 202010742424.0 申请日: 2020-07-29
公开(公告)号: CN111882449B 公开(公告)日: 2022-09-02
发明(设计)人: 赵晓娟;王培;常春喜;陈恺;王昌海;马锶霞;李晨晨 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06Q50/00 分类号: G06Q50/00;G06F21/62;G06N3/08;G06N3/04
代理公司: 长沙国科天河知识产权代理有限公司 43225 代理人: 周达
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 社交 网络 匿名 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及一种社交网络去匿名方法、装置、计算机设备和存储介质。所述方法包括:对预先获取的社交网络进行匿名处理,得到匿名网络;采用随机游走策略,获取匿名网络中预设步数的用户节点序列,根据用户节点序列,构建用户语料库;利用预先设置的词向量模型对用户语料库中的用户进行嵌入,得到用户节点向量;获取预先设置的辅助网络,根据辅助网络中用户节点和匿名网络中用户节点,构建种子节点对;将种子节点对对应的向量对输入预先设置的全连接神经网络,得到训练好的全连接神经网络;将匿名网络中待预测的用户节点向量输入训练好的全连接神经网络,输出所述辅助网络中去匿名的匹配结果。采用本方法能够对匿名处理效果进行检测。

技术领域

本申请涉及图数据处理技术领域,特别是涉及一种社交网络去匿名方法、装置、计算机设备和存储介质。

背景技术

社交网络时刻产生海量的数据,这些数据中蕴含着无数的应用价值。数据挖掘技术是在这种背景下出现和发展的。随着数据挖掘技术的发展,数据挖掘给各个领域带了巨大的价值,包括商业领域,工程领域,医药领域等诸多领域。

伴随社交网络数据挖掘而来的是用户的隐私问题。一份调查显示,网上用户随时面临着财产信息、身份信息、出行信息泄露的风险,同时还会受到软件病毒的威胁,而且,威胁程度与日俱增。社交网络俨然已经成为黑客的巨大目标。社交网络数据可以抽象为图结构数据,图中的节点代表社交网络的用户,边代表社交网络用户之间的关系,对社交网络结构的研究可以抽象为对图结构的研究,类似的结构还有WIFI,蓝牙,即时消息等。数据发布中隐私保护主要针对的是用户的敏感数据、人物身份以及人物关系,现有的手段一般包括删除标志符,K匿名,差分隐私等手段。所有匿名数据都需要通过去匿名技术的检测,去匿名技术可以检测匿名效果,同时逆向提高匿名技术,促进匿名技术的发展,更好的保护用户的隐私。

发明内容

基于此,有必要针对上述技术问题,提供一种社交网络去匿名方法、装置、计算机设备和存储介质。

一种社交网络去匿名方法,所述方法包括:

对预先获取的社交网络进行匿名处理,得到匿名网络;

采用随机游走策略,获取所述匿名网络中预设步数的用户节点序列,根据所述用户节点序列,构建用户语料库;

利用预先设置的词向量模型对所述用户语料库中的用户进行嵌入,得到用户节点向量;

获取预先设置的辅助网络,根据所述辅助网络中用户节点和所述匿名网络中用户节点,构建种子节点对;

将所述种子节点对对应的向量对输入预先设置的全连接神经网络,得到训练好的全连接神经网络;

将匿名网络中待预测的用户节点向量输入训练好的全连接神经网络,输出所述辅助网络中去匿名的匹配结果。

在其中一个实施例中,还包括:获取社交网络中的连边信息;根据预先设置的噪声率,删除所述社交网络中的n%条边,得到剩余连边集合;随机添加n%条边,得到新增连边集合;根据所述剩余连边集合和所述新增连边集合,得到匿名网络。

在其中一个实施例中,还包括:随机生成一条检测边,当所述检测边不在剩余连边集合和所述新增连边集合中时,将所述检测边加入所述新增连边集合;以及,删除所述新增连边集合中与所述剩余连边集合相同的边。

在其中一个实施例中,还包括:对所述用户语料库中的用户节点序列进行one-hot编码,得到N维向量;利用N维向量训练预先设置的Skip-Gram模型,得到训练好的Skip-Gram模型;通过训练好的Skip-Gram模型输出用户节点向量。

在其中一个实施例中,还包括:设置损失函数为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010742424.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top