[发明专利]一种基于差分隐私的网络结构学习方法在审
申请号: | 202011297920.6 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112364380A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 张海;卢耀宗;苏温庆 | 申请(专利权)人: | 陕西数盾慧安数据科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06N20/00 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 张举 |
地址: | 710199 陕西省西安市国家民用航天产*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 网络 结构 学习方法 | ||
1.一种基于差分隐私的网络结构学习方法,其特征在于,包括以下步骤:
步骤1:以待学习的网络数据作为输入;
步骤2:对网络数据进行归一化处理,形成归一化的数据矩阵XX;
对于n×pn×p的数据矩阵DD,计算每行数据向量的二范数,记其中最大值为MaxMax,令X=D/Max为归一化的数据矩阵XX;
步骤3:确定差分隐私算法的隐私参数εε和δδ;
步骤4:根据步骤2得到的归一化的数据矩阵XX及步骤3确定的隐私参数εε和δδ,确定高斯噪声机制中高斯分布的标准差ββ;
步骤5:基于步骤4给出的标准差ββ,生成对称噪声矩阵NN;
步骤6:基于步骤5给出的对称噪声矩阵NN,生成扰动的样本协方差矩阵
步骤7:基于扰动后的样本协方差矩阵解得网络结构。
2.根据权利要求1所述的基于差分隐私的网络结构学习方法,其特征在于,所述步骤3根据对隐私保护程度的具体要求给定隐私参数,εε取大于0的任何数,εε取值越小代表隐私保护程度越强,反之εε取值越大代表隐私保护程度越弱,δδ取为与1/n1/n同阶的正值,n为样本量。
3.根据权利要求2所述的基于差分隐私的网络结构学习方法,其特征在于,所述步骤4具体包括:
高斯噪声机制中高斯分布的标准差由目标函数的L2L2敏感度和步骤3确定的隐私预算εε和δδ共同决定;对于由步骤2得到的归一化的数据矩阵XX,其样本协方差矩阵为f(X)=XTX/nf(X)=XTX/n,若将XX视为维度为p2p2的实值向量,则L2L2敏感度为:
式中,XT为XX的转置矩阵,X′X′为XX的邻接矩阵,即数据矩阵X′X′与XX只有一行数据不相同;
则高斯噪声机制中高斯分布的标准差为
4.根据权利要求3所述的基于差分隐私的网络结构学习方法,其特征在于,所述步骤5具体包括:基于步骤4给出的标准差ββ,通过高斯分布N(0,β2)N(0,β2)生成p(p+1)/2p(p+1)/2个噪声,并将其按行排列为p×pp×p的上三角矩阵之后令下三角元素等于上三角对应元素,即令其中i,j∈{1,2,...,p}i,j∈{1,2,...,p},最终生成对称的噪声矩阵NN。
5.根据权利要求4所述的基于差分隐私的网络结构学习方法,其特征在于,所述步骤6具体包括:通过XTXXTX和步骤5确定的对称噪声矩阵NN生成扰动的样本协方差矩阵具体的
为保证扰动后的样本协方差矩阵非负定,对进行特征值分解得到特征值和对应的特征向量,将负的特征值替换为零,再由新的特征值和特征向量得到非负定的
6.根据权利要求5所述的基于差分隐私的网络结构学习方法,其特征在于,所述步骤7具体包括:
基于扰动后的样本协方差矩阵求解Graphicallasso模型,给定调控参数λλ,学习出潜在网络结构;具体采用交替方向乘子法求解,给定预选参数ρρ和迭代次数KK,依次求解以下最优化问题KK次;
Uk+1=Uk+Θk+1-Zk+1
式中,ΘΘ为协方差矩阵的逆,ZZ为辅助变量,UU为对偶变量,要求ΘΘ和ZZ均为正定矩阵;给定变量ZZ和UU的初始值均为单位矩阵,最终给出ΘΘ的估计若则节点ii与节点jj之间有边连接,若则节点ii与节点jj之间无边连接,也即学习出潜在网络结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数盾慧安数据科技有限公司,未经陕西数盾慧安数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011297920.6/1.html,转载请声明来源钻瓜专利网。