[发明专利]社交网络图结构匿名化处理方法及装置在审
申请号: | 202211731149.8 | 申请日: | 2022-12-30 |
公开(公告)号: | CN116070266A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 王丽宏;马莉雅;贺敏;刘婧;郭舒;毛乾任;李晨;黄洪仁;钟盛海 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q50/00 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 由东媛 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络图 结构 匿名 处理 方法 装置 | ||
1.一种社交网络图结构匿名化处理方法,其特征在于,所述方法包括:
获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;
在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;
将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;
其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。
2.根据权利要求1所述的方法,其特征在于,所述在所述原始图数据对应的所有的边中确定隐私边,包括:
利用最大生成树算法基于预设的节点属性参数生成所述原始图数据对应的生成树,所述生成树中所有的边构成第一边集合;
将所述原始图数据中除所述第一边集合之外的边,划分至第二边集合;
在所述第二边集合中确定所述隐私边。
3.根据权利要求1所述的方法,其特征在于,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征之后,在所述图嵌入特征中加入噪声,并基于加入噪声后的所述图嵌入特征输出对应的匿名图。
4.根据权利要求3所述的方法,其特征在于,通过以下步骤训练得到所述匿名图生成模型:
获取样本图数据;
在所述样本图数据对应的所有的边中确定样本隐私边,并在所述样本图数据中删除所述样本隐私边得到样本处理图;
基于所述样本处理图和所述样本隐私边确定训练数据;
在预设损失函数的约束下,利用所述训练数据训练原始处理模型,直至所述预设损失函数小于预设阈值,得到所述匿名图生成模型,其中,所述预设损失函数用于调节所述噪声的强度。
5.根据权利要求4所述的方法,其特征在于,所述基于所述样本处理图和所述样本隐私边确定训练数据,包括:
在所述样本处理图所包含的所有边中,将所述样本隐私边的端节点所连接的边标记为相关敏感边;
将所述样本处理图所包含的所有边中,除所述相关敏感边之外的边标记为非相关敏感边;
将标记好的所述样本处理图确定为所述训练数据。
6.根据权利要求4所述的方法,其特征在于,所述基于所述样本处理图和所述样本隐私边确定训练数据,包括:
在所述样本处理图所包含的所有节点中,将所述样本隐私边的端节点标记为敏感节点;
将所述样本处理图所包含的所有节点中,除所述敏感节点之外的节点标记为非敏感节点;
将标记好的所述样本处理图确定为所述训练数据。
7.根据权利要求6所述的方法,其特征在于,所述预设损失函数为,对所述敏感节点进行链接预测得到的第一准确度数据,对所述非敏感节点进行链接预测得到的第二准确度数据,所述匿名图生成模型生成的匿名图与所述原始图数据之间的相似度数据,以及,所述对所述匿名图仅链接推断攻击测试的第三准确度数据之和。
8.根据权利要求4所述的方法,其特征在于,所述得到所述匿名图生成模型之后,还包括:
获取预设的模型评价指标,其中,所述模型评价指标包括所述匿名图对应的隐私性指标、可用性指标及平衡程度指标中的任意一种指标或多种指标的组合;
确定所述匿名图生成模型是否符合所述模型评价指标对应的指标条件;
在确定所述匿名图生成模型不符合对应的指标条件的情况下,对所述匿名图生成模型进行优化,直至所述匿名图生成模型符合所述指标条件。
9.一种社交网络图结构匿名化处理装置,其特征在于,所述装置包括:
获取模块,用于获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;
确定模块,用于在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;
输入模块,用于将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;
其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211731149.8/1.html,转载请声明来源钻瓜专利网。