[发明专利]一种基于差分隐私的在线分类方法在审
申请号: | 202110282401.0 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113158230A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张海;卢耀宗;苏温庆 | 申请(专利权)人: | 陕西数盾慧安数据科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2455;G06K9/62 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 张举 |
地址: | 710003 陕西省西安市国家民用航天产*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 在线 分类 方法 | ||
1.一种基于差分隐私的在线分类方法,其特征在于,包括以下步骤:
步骤1:输入待学习的流数据;
步骤2:对流数据进行归一化处理,形成归一化的数据矩阵;
步骤3:确定Logistic分类问题的目标函数的敏感度;
步骤4:确定差分隐私算法的隐私参数;
根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;
步骤5:生成目标扰动的噪声向量;
步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度;
步骤7:更新分类超平面;
步骤8:重复上述步骤得到在线分类器,并给出总的隐私消耗。
2.根据权利要求1所述的基于差分隐私的在线分类方法,其特征在于,所述步骤1中:
通过一批一批的记录累积得到流数据,将最新一批数据作为输入,记第t批数据为Pt=(Zt,Yt),其中Zt为属性数据矩阵,Yt为类标签数据向量,要求Yt中元素的值属于{-1,+1},给出Pt的样本量nt和Zt的维度p。
3.根据权利要求2所述的基于差分隐私的在线分类方法,其特征在于,所述步骤2中:
对于nt×P的属性数据矩阵Zt,计算每行数据向量的二范数,记其中最大值为Max,令Xt=Zt/Max为归一化的属性数据矩阵,Dt=(Xt,Yt)为归一化的数据矩阵。
4.根据权利要求3所述的基于差分隐私的在线分类方法,其特征在于,所述步骤3中:
对于分类指标属于{-1,+1}的分类问题,具有罚项的Logistic分类模型的目标函数为:
其中,样本点(xi,yi)为数据集Dt=(Xt,Yt)中的个体,nt为样本量,ωt为待估计的分类超平面,λ为惩罚参数,惩罚参数需预先给定;
对于经过步骤2预处理的归一化数据矩阵Dt=(Xt,Yt),Logistic分类问题的目标函数的L2敏感度为:
这里Dt′为Dt的邻接矩阵,即数据矩阵Dt′与Dt只有一行数据不相同。
5.根据权利要求4所述的基于差分隐私的在线分类方法,其特征在于,所述步骤5中:
基于步骤3给出的敏感度与步骤4给出的隐私参数生产噪声向量bt,具体的:
bt=B·N
这里B为p维单位球球面的一个随机点,N为抽取自伽马分布的随机数,其中p为形状参数,为尺度参数,尺度参数由步骤3给出的敏感度与步骤4给出的隐私参数共同确定;B的生成方式为首先生成一个[-1,1]上的p维随机向量之后通过将其转化到单位球面上,这里表示随机向量的二范数。
6.根据权利要求4所述的基于差分隐私的在线分类方法,其特征在于,所述步骤6中:
基于步骤5生成的噪声向量bt,基于目标扰动方法的Logistic分类问题的目标函数为:
其梯度向量为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数盾慧安数据科技有限公司,未经陕西数盾慧安数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110282401.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双头可着色的眼镜腿
- 下一篇:一种直流电机驱动器的ESD防护电路拓扑