[发明专利]一种基于差分隐私的在线分类方法在审

专利信息
申请号: 202110282401.0 申请日: 2021-03-16
公开(公告)号: CN113158230A 公开(公告)日: 2021-07-23
发明(设计)人: 张海;卢耀宗;苏温庆 申请(专利权)人: 陕西数盾慧安数据科技有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F16/2455;G06K9/62
代理公司: 西安铭泽知识产权代理事务所(普通合伙) 61223 代理人: 张举
地址: 710003 陕西省西安市国家民用航天产*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 隐私 在线 分类 方法
【权利要求书】:

1.一种基于差分隐私的在线分类方法,其特征在于,包括以下步骤:

步骤1:输入待学习的流数据;

步骤2:对流数据进行归一化处理,形成归一化的数据矩阵;

步骤3:确定Logistic分类问题的目标函数的敏感度;

步骤4:确定差分隐私算法的隐私参数;

根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;

步骤5:生成目标扰动的噪声向量;

步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度;

步骤7:更新分类超平面;

步骤8:重复上述步骤得到在线分类器,并给出总的隐私消耗。

2.根据权利要求1所述的基于差分隐私的在线分类方法,其特征在于,所述步骤1中:

通过一批一批的记录累积得到流数据,将最新一批数据作为输入,记第t批数据为Pt=(Zt,Yt),其中Zt为属性数据矩阵,Yt为类标签数据向量,要求Yt中元素的值属于{-1,+1},给出Pt的样本量nt和Zt的维度p。

3.根据权利要求2所述的基于差分隐私的在线分类方法,其特征在于,所述步骤2中:

对于nt×P的属性数据矩阵Zt,计算每行数据向量的二范数,记其中最大值为Max,令Xt=Zt/Max为归一化的属性数据矩阵,Dt=(Xt,Yt)为归一化的数据矩阵。

4.根据权利要求3所述的基于差分隐私的在线分类方法,其特征在于,所述步骤3中:

对于分类指标属于{-1,+1}的分类问题,具有罚项的Logistic分类模型的目标函数为:

其中,样本点(xi,yi)为数据集Dt=(Xt,Yt)中的个体,nt为样本量,ωt为待估计的分类超平面,λ为惩罚参数,惩罚参数需预先给定;

对于经过步骤2预处理的归一化数据矩阵Dt=(Xt,Yt),Logistic分类问题的目标函数的L2敏感度为:

这里Dt′为Dt的邻接矩阵,即数据矩阵Dt′与Dt只有一行数据不相同。

5.根据权利要求4所述的基于差分隐私的在线分类方法,其特征在于,所述步骤5中:

基于步骤3给出的敏感度与步骤4给出的隐私参数生产噪声向量bt,具体的:

bt=B·N

这里B为p维单位球球面的一个随机点,N为抽取自伽马分布的随机数,其中p为形状参数,为尺度参数,尺度参数由步骤3给出的敏感度与步骤4给出的隐私参数共同确定;B的生成方式为首先生成一个[-1,1]上的p维随机向量之后通过将其转化到单位球面上,这里表示随机向量的二范数。

6.根据权利要求4所述的基于差分隐私的在线分类方法,其特征在于,所述步骤6中:

基于步骤5生成的噪声向量bt,基于目标扰动方法的Logistic分类问题的目标函数为:

其梯度向量为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数盾慧安数据科技有限公司,未经陕西数盾慧安数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110282401.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top