[发明专利]一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法有效
申请号: | 201910038938.5 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109784091B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 钟尚平;郭鹏;陈开志 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法。包括步骤1:使用原始表格数据训练差分隐私生成模型;步骤2:使用原始表格数据在差分隐私预算下训练教师分类器;步骤3:使用生成模型生成“虚假”表格数据,并使用教师分类器对“虚假”表格数据预测标签,挑选预测标签和生成标签一致的数据,定义“可用”数据集,使用“可用”数据集训练学生分类器;步骤4:将生成模型和学生分类器发布,使用生成模型合成数据,使用学生模型挑选数据,完成数据分析任务。本发明方法是在数据发布阶段对表格数据实施隐私保护,数据分析师不可以通过生成模型复原原始训练数据,也不能通过学生模型推测原始训练数据,实现对原始表格数据的保护,并满足数据分析师对数据的需求。 | ||
搜索关键词: | 一种 融合 隐私 gan pate 模型 表格 数据 保护 方法 | ||
【主权项】:
1.一种融合差分隐私GAN和PATE模型的表格数据隐私保护方法,其特征在于,包括如下步骤:步骤S1、使用原始表格数据训练差分隐私生成模型;步骤S2、使用原始表格数据在差分隐私预算下训练教师分类器;步骤S3、使用差分隐私生成模型生成虚假表格数据及对应生成标签,并使用教师分类器对虚假表格数据预测标签,挑选预测标签和生成标签一致的数据,定义可用数据集,使用可用数据集训练学生分类器;步骤S4、将差分隐私生成模型和学生分类器发布,数据分析师使用差分隐私生成模型生成数据,而后通过学生分类器挑选数据,即可完成数据分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910038938.5/,转载请声明来源钻瓜专利网。