[发明专利]一种基于对抗样本增强模型抗攻击能力的方法和系统在审
申请号: | 201911289070.2 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111046394A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 郇兆鑫;张晓露;简伟健 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06N3/04 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 样本 增强 模型 攻击 能力 方法 系统 | ||
1.一种基于对抗样本增强模型抗攻击能力的方法,其中,所述方法包括:
获取目标样本的集合;
将所述集合中的每一所述目标样本输入目标模型,得到与所述目标样本对应的第一输出,所述第一输出用于表征该第一输出对应的标签的置信度;
在所述第一输出大于或等于输出阈值时,将所述目标模型的所述第一输出对应的标签作为所述目标样本的目标标签;
利用所述目标样本的集合和所述目标样本对应的所述目标标签训练替代模型;
将候选样本输入所述替代模型,得到对应于所述候选样本的第二输出,并基于该第二输出调整所述候选样本以得到对抗样本;
基于该对抗样本,调整所述目标模型,以增强所述目标模型的抗攻击能力。
2.如权利要求1所述的方法,其中,所述将所述集合中的每一所述目标样本输入所述目标模型之后,所述方法还包括:
在所述第一输出小于所述输出阈值时,从所述集合中删除该第一输出对应的所述目标样本。
3.如权利要求1所述的方法,其中,所述第一输出为所述目标模型的logits层的输出,或所述目标模型的激活层的输出,其中,所述激活层的输出与所述激活层的输入正相关。
4.如权利要求1所述的方法,其中,所述将所述目标模型的所述第一输出对应的标签作为所述目标样本的目标标签,包括:
在同一所述目标样本对应的所有所述第一输出中,将所述置信度最大的所述第一输出作为目标输出;
将所述目标输出对应的标签作为所述目标样本的所述目标标签。
5.如权利要求1所述的方法,其中,所述基于该对抗样本,调整所述目标模型,以增强所述目标模型的抗攻击能力,包括:
将所述对抗样本输入所述目标模型,得到与所述对抗样本对应的输出,该输出用于表征所述对抗样本属于该输出对应类别的概率;
针对同一所述对抗样本,若该对抗样本的所有该输出中的最大值对应的标签与所述对抗样本的真实标签不同,则判定该对抗样本对所述目标模型攻击成功;
针对多个所述对抗样本,统计对应于该多个所述目标样本的所述攻击的成功次数在所述攻击的总次数中的比例,并基于该比例调整所述目标模型,以增强所述目标模型的抗攻击能力。
6.如权利要求1所述的方法,其中,所述候选样本为图像样本;所述调整所述候选样本包括:调整所述候选样本中若干像素的值,其中被调整的每个像素的值的变化范围小于像素阈值。
7.如权利要求1所述的方法,其中,所述目标模型为用于对图片进行识别的模型,所述目标样本为图片。
8.一种基于对抗样本增强模型抗攻击能力的系统,其中,所述系统包括:
获取模块,用于获取目标样本的集合;
输入模块,将所述集合中的每一所述目标样本输入目标模型,得到与所述目标样本对应的第一输出,所述第一输出用于表征该第一输出对应的标签的置信度;
标签调整模块,用于在所述第一输出大于或等于输出阈值时,将所述目标模型的所述第一输出对应的标签作为所述目标样本的目标标签;
训练模块,用于利用所述目标样本的集合和所述目标样本对应的所述目标标签训练替代模型;
对抗样本生成模块,用于将候选样本输入所述替代模型,得到对应于所述候选样本的第二输出,并基于该第二输出调整所述候选样本以得到对抗样本;
增强模块,用于基于该对抗样本,调整所述目标模型,以增强所述目标模型的抗攻击能力。
9.如权利要求8所述的系统,所述系统还包括:
删除模块,用于在所述输入模块将所述集合中的每一所述目标样本输入所述目标模型之后,且在所述第一输出小于所述输出阈值时,从所述集合中删除该第一输出对应的所述目标样本。
10.如权利要求8所述的系统,其中,所述第一输出为所述目标模型的logits层的输出,或所述目标模型的激活层的输出,其中,所述激活层的输出与所述激活层的输入正相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911289070.2/1.html,转载请声明来源钻瓜专利网。