[发明专利]基于对抗样本的抗成员推理攻击的AI模型隐私保护方法在审
申请号: | 201910654693.9 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110516812A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 吴至禹;薛明富;刘雨薇;刘雯霞 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N5/04 |
代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 康燕文<国际申请>=<国际公布>=<进入 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于对抗样本的抗成员推理攻击的AI模型隐私保护方法,包括如下步骤:(1)用普通方式训练目标模型;(2)通过与目标模型交互训练的方式得到训练好的成员推理模型;(3)当目标模型接收到输入时,将目标模型输出的预测标签向量和该预测标签向量经过独热编码转换后的独热标签向量输入到训练好的成员推理模型中,再利用成员推理模型的输出使用快速梯度符号法对目标模型输出的预测标签向量进行扰动,构造出针对成员推理模型的对抗样本;(4)目标模型以50%的概率输出对抗样本,否则保持原输出不变。本发明消除了传统防御方式所带来的梯度不稳定、训练时间长、收敛速度慢等问题。 | ||
搜索关键词: | 目标模型 推理模型 标签向量 输出 样本 对抗 预测 防御方式 概率输出 交互训练 训练目标 隐私保护 符号法 热编码 热标签 再利用 扰动 推理 向量 收敛 攻击 转换 | ||
【主权项】:
1.一种基于对抗样本的抗成员推理攻击的AI模型隐私保护方法,其特征在于,包括以下步骤:/n(1)用普通无防御方式训练目标模型;/n(2)将成员推理模型与目标模型进行交互训练得到训练好的成员推理模型;训练成员推理模型的方式为,将数据输入到目标模型中得到目标模型输出的预测标签向量,将目标模型输出的预测标量向量和数据原始标签输入到成员推理模型中得到成员推理模型的输出,以梯度下降的方式调整成员推理模型的参数,迭代训练成员推理模型直到达到设置的迭代步数为止;/n(3)当目标模型接收到数据输入时,将目标模型输出的预测标签向量和该预测标签向量经过独热编码转换后的独热标签输入到步骤(2)训练好的成员推理模型中,再利用成员推理模型的输出使用快速梯度符号法对目标模型输出的预测标签向量进行扰动,即构造出针对成员推理模型的对抗样本;以50%的概率将对抗样本作为目标模型的最终输出,否则保持原输出不变。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910654693.9/,转载请声明来源钻瓜专利网。