[发明专利]社交网络图结构匿名化处理方法及装置在审
申请号: | 202211731149.8 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116070266A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 王丽宏;马莉雅;贺敏;刘婧;郭舒;毛乾任;李晨;黄洪仁;钟盛海 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q50/00 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 由东媛 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络图 结构 匿名 处理 方法 装置 | ||
本申请提供了一种社交网络图结构匿名化处理方法及装置,属于数据安全技术领域。本申请通过,获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。由此可以有效抵御攻击者结合图嵌入技术进行的推断攻击,提高匿名处理的安全性。
技术领域
本申请涉及数据安全技术领域,尤其涉及一种社交网络图结构匿名化处理方法及装置。
背景技术
随着在线社交网络的不断发展,用户之间联系日益密切,产生了大量社交网络图结构,比如电话、微信聊天、微博超话,邮件等。这些社交网络图结构为商业营销、科学研究提供了重要数据基础。但是,由于社交网络图结构中包含了用户大量的关系数据、属性数据和边权重数据等重要隐私信息,一旦被攻击者攻击而泄露,会严重危害用户的隐私安全。因此,在社交网络图结构发布和分析之前,需要进行匿名处理。
目前,常用的匿名化方法是图匿名化方法,具体为:构建社交网络图结构所构成的原始图数据,通过增删该原始图数据中的边或节点等图修改操作,得到相应的匿名图,从而实现对社交网络图结构的匿名处理,防止个人隐私泄露。
然而,通过图匿名化方法对社交网络图结构进行匿名处理,安全性不够高,容易被攻击者结合图嵌入技术进行推断攻击。
发明内容
为了解决上述通过图匿名化方法对社交网络图结构进行匿名处理,安全性不够高,容易被攻击者结合图嵌入技术进行推断攻击的技术问题,本申请提供了一种社交网络图结构匿名化处理方法及装置。
第一方面,提供了一种社交网络图结构匿名化处理方法,所述方法包括:
获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;
在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;
将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;
其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。
在一个可能的实施方式中,所述在所述原始图数据对应的所有的边中确定隐私边,包括:
利用最大生成树算法基于预设的节点属性参数生成所述原始图数据对应的生成树,所述生成树中所有的边构成第一边集合;
将所述原始图数据中除所述第一边集合之外的边,划分至第二边集合;
在所述第二边集合中确定所述隐私边。
在一个可能的实施方式中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征之后,在所述图嵌入特征中加入噪声,并基于加入噪声后的所述图嵌入特征输出对应的匿名图。
在一个可能的实施方式中,通过以下步骤训练得到所述匿名图生成模型:
获取样本图数据;
在所述样本图数据对应的所有的边中确定样本隐私边,并在所述样本图数据中删除所述样本隐私边得到样本处理图;
基于所述样本处理图和所述样本隐私边确定训练数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211731149.8/2.html,转载请声明来源钻瓜专利网。