[发明专利]一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法有效

专利信息
申请号: 201910038938.5 申请日: 2019-01-16
公开(公告)号: CN109784091B 公开(公告)日: 2022-11-22
发明(设计)人: 钟尚平;郭鹏;陈开志 申请(专利权)人: 福州大学
主分类号: G06F21/62 分类号: G06F21/62;G06K9/62
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福州市闽*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 隐私 gan pate 模型 表格 数据 保护 方法
【说明书】:

发明涉及一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法。包括步骤1:使用原始表格数据训练差分隐私生成模型;步骤2:使用原始表格数据在差分隐私预算下训练教师分类器;步骤3:使用生成模型生成“虚假”表格数据,并使用教师分类器对“虚假”表格数据预测标签,挑选预测标签和生成标签一致的数据,定义“可用”数据集,使用“可用”数据集训练学生分类器;步骤4:将生成模型和学生分类器发布,使用生成模型合成数据,使用学生模型挑选数据,完成数据分析任务。本发明方法是在数据发布阶段对表格数据实施隐私保护,数据分析师不可以通过生成模型复原原始训练数据,也不能通过学生模型推测原始训练数据,实现对原始表格数据的保护,并满足数据分析师对数据的需求。

技术领域

本发明涉及对表格数据发布阶段的隐私保护方法,具体涉及一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法。

背景技术

大数据时代,机器学习从数据集提取有用的信息训练模型,为人们生活提供便利,同时产生的数据安全和用户隐私问题也需要引起重视,数据隐私保护方法用来调和二者之间的利益冲突。

生成对抗网络具有可以快速大规模生成数据的特点,但是训练集中个别样例对生成模型的影响较大,生成的数据可能会暴露个别样例的隐私问题。攻击者通过多次使用生成模型生成数据,再结合特殊计算方法可能会复原训练集中个别样例。因此,在对抗网络训练过程中引入差分隐私能降低个别样例对生成模型的影响,即对判别部分设置梯度裁剪阈值,使梯度更新在一定范围内。但是目前存在的方法通常固定裁剪阈值,本文提出梯度阈值自适应选取方法。并且本文创新性的提出使用教师系综聚合模型来挑选生成的“虚假”表格数据的方法,这样通过挑选后的“虚假”数据能够满足数据分析师对大量数据的需求,完成不同的数据分析任务。

发明内容

本发明的目的在于提供一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法,该方法结合生成模型和分类模型实现对表格数据发布阶段的隐私保护。

为实现上述目的,本发明的技术方案是:一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法,包括如下步骤:

步骤S1、使用原始表格数据训练差分隐私生成模型;

步骤S2、使用原始表格数据在差分隐私预算下训练教师分类器;

步骤S3、使用差分隐私生成模型生成虚假表格数据及对应生成标签,并使用教师分类器对虚假表格数据预测标签,挑选预测标签和生成标签一致的数据,定义可用数据集,使用可用数据集训练学生分类器;

步骤S4、将差分隐私生成模型和学生分类器发布,数据分析师使用差分隐私生成模型生成数据,而后通过学生分类器挑选数据,即可完成数据分析。

在本发明一实施例中,所述步骤S1中,差分隐私生成模型训练过程包括两部分:生成对抗网络训练和判别模型添加噪音扰动,具体如下:

步骤S11、对抗网络的选择:

辅助分类生成对抗网络使用原始表格数据和标签作为输入,在判别模型部分不仅判别数据真假,还预测数据所属类别,因此选择辅助分类生成对抗网络作为差分隐私生成模型训练网络;

步骤S12、扰动噪音的选择:

差分隐私中添加的噪音大小和查询的敏感度相关,根据隐私预算值和自适应选取设定的梯度裁剪阈值,计算噪音大小。

在本发明一实施例中,所述步骤S12,具体实现如下:

首先,为了更好的设置梯度裁剪阈值,提出自适应选取设定梯度裁剪阈值:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910038938.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top