[发明专利]一种获取对抗样本生成模型的方法和系统在审
申请号: | 202010409787.2 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111340143A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 任彦昆 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 对抗 样本 生成 模型 方法 系统 | ||
1.一种获取对抗样本生成模型的方法,其中,所述方法包括:
获取多个训练样本;
对于多个训练样本的每一个进行以下处理,迭代更新对抗样本生成模型的参数,获取训练完成的对抗样本生成模型:
输入对抗样本生成模型,以获取该训练样本相对应的构造样本;
将所述构造样本输入到目标模型,以得到目标模型对所述构造样本的处理结果,并基于所述处理结果确定惩罚值;
基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数;所述第一损失函数与所述差异以及所述惩罚值均正相关;
调节对抗样本生成模型的参数,以减小第一损失函数。
2.根据权利要求1所述的方法,其中,在所述对于多个训练样本的每一个进行以下处理,迭代更新对抗样本生成模型的参数,获取训练完成的对抗样本生成模型之前,还包括:
利用多个训练样本对所述对抗样本生成模型进行预训练,以减小所述对抗样本生成模型输出的构造样本与其对应的训练样本之间的差异。
3.根据权利要求1或2所述的方法,其中,所述训练样本为文本样本,所述对抗样本生成模型至少包括序列到序列模型;
所述构造样本与其对应的训练样本的差异包括构造样本对应的向量表示与其对应的训练样本对应的向量表示之间的距离。
4.根据权利要求1所述的方法,其中,所述基于所述处理结果确定惩罚值,包括:
当目标模型对所述构造样本的处理结果与该目标模型对所述构造样本对应的训练样本的处理结果一致时,将所述惩罚值设为正值,否则将所述惩罚值设为负值。
5.根据权利要求4所述的方法,其中,所述训练样本为文本样本,所述对抗样本生成模型至少包括序列到序列模型,所述序列到序列模型还输出构造样本为其对应的训练样本的对抗样本的概率;
所述惩罚值的绝对值与所述概率正相关。
6.一种对抗样本生成方法,其中,所述方法包括:
获取原始样本;
利用对抗样本生成模型处理所述原始样本,得到构造样本,并将所述构造样本确定为对应于原始样本的对抗样本,其中,所述对抗样本生成模型基于如权利要求1至5中任意一项所述的方法确定。
7.一种获取对抗样本生成模型的系统,其中,所述系统包括:
第一获取模块,用于获取多个训练样本;
第一处理模块,用于对于多个训练样本的每一个进行以下处理,迭代更新对抗样本生成模型的参数,获取训练完成的对抗样本生成模型,包括:
输入对抗样本生成模型,以获取该训练样本相对应的构造样本;
将所述构造样本输入到目标模型,以得到目标模型对所述构造样本的处理结果,并基于所述处理结果确定惩罚值;
基于构造样本与其对应的训练样本的差异、以及惩罚值构造第一损失函数;
调节对抗样本生成模型的参数,以减小第一损失函数。
8.根据权利要求7所述的系统,其中,所述系统还包括:
预训练模块,用于利用多个训练样本对所述对抗样本生成模型进行预训练,以减小所述对抗样本生成模型输出的构造样本与其对应的训练样本之间的差异。
9.根据权利要求7或8所述的系统,其中,所述训练样本为文本样本,所述对抗样本生成模型至少包括序列到序列模型;
所述构造样本与其对应的训练样本的差异包括构造样本对应的向量表示与其对应的训练样本对应的向量表示之间的距离。
10.根据权利要求7所述的系统,其中,为基于所述处理结果确定惩罚值,所述第一处理模块用于:
当目标模型对所述构造样本的处理结果与该目标模型对所述构造样本对应的训练样本的处理结果一致时,将所述惩罚值设为正值,否则将所述惩罚值设为负值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010409787.2/1.html,转载请声明来源钻瓜专利网。