[发明专利]一种基于差分隐私的在线分类方法在审
申请号: | 202110282401.0 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113158230A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 张海;卢耀宗;苏温庆 | 申请(专利权)人: | 陕西数盾慧安数据科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2455;G06K9/62 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 张举 |
地址: | 710003 陕西省西安市国家民用航天产*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 在线 分类 方法 | ||
本发明提供了一种基于差分隐私的在线分类方法,属于分类方法领域,包括:输入待学习的流数据;对流数据进行归一化处理,形成归一化的数据矩阵;确定Logistic分类问题的目标函数的敏感度;确定差分隐私算法的隐私参数;根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt可取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;生成目标扰动的噪声向量;给出目标扰动后Logistic分类问题的目标函数的梯度;更新分类超平面;重复上述步骤得到在线分类器,并给出总的隐私消耗。本发明解决了该模型差分隐私求解问题,保证分类器的学习过程不泄漏数据中个体的隐私。
技术领域
本发明属于分类方法领域,具体涉及一种基于差分隐私的在线分类方法。
背景技术
在线分类问题已受到广泛关注,形成了一系列围绕求解在线问题的快速算法,包括在线梯度下降法,在线牛顿方法等。其中在线梯度下降法是在借鉴传统的梯度信息的基础上,借助批次梯度代替整体梯度,使得算法的时间消耗和计算成本有效降低。在在线梯度下降法的基础上涌现出大量二分类的快速求解问题的研究结果,包括模型,理论等各个方面。但现有方法很少涉及到算法的隐私保护问题。
市场化的今天,高效运行的方法是符合主流需求的算法,但是在处理大量流式数据时,可能会涉及到个人的敏感数据,这同样制约着数据要素的高效配置。因此,在保证个体隐私不被泄露的条件下学习高效的在线分类算法将加速提升数据要素价值。如何实现现有的在线梯度下降法既可用于分析包含隐私敏感信息的数据,又能保证算法运行效率是个亟待解决的问题。
为使得在线梯度下降法可以高效的分析包含敏感信息的数据,本申请在隐私保护的新范式——差分隐私框架下给出在线Logistic回归新的求解算法,提出一种基于差分隐私的在线分类方法。
发明内容
为了克服上述现有技术存在的不足,本发明提供了一种基于差分隐私的在线分类方法。
为了实现上述目的,本发明提供如下技术方案:
一种基于差分隐私的在线分类方法,包括以下步骤:
步骤1:输入待学习的流数据;
步骤2:对流数据进行归一化处理,形成归一化的数据矩阵;
步骤3:确定Logistic分类问题的目标函数的敏感度;
步骤4:确定差分隐私算法的隐私参数;
根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt可取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;
步骤5:生成目标扰动的噪声向量;
步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度;
步骤7:更新分类超平面;
步骤8:重复上述步骤得到在线分类器,并给出总的隐私消耗。
优选地,所述步骤1中:
通过一批一批的记录累积得到流数据,将最新一批数据作为输入,记第t批数据为Pt(Zt,Yt),其中Zt为属性数据矩阵,Yt为类标签数据向量,要求Yt中元素的值属于{-1,+1},给出Pt的样本量nt和Zt的维度p。
优选地,所述步骤2中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数盾慧安数据科技有限公司,未经陕西数盾慧安数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110282401.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双头可着色的眼镜腿
- 下一篇:一种直流电机驱动器的ESD防护电路拓扑