[发明专利]用于生成对抗样本的方法、模型评估方法、装置和计算机设备有效
申请号: | 202111456965.8 | 申请日: | 2021-12-02 |
公开(公告)号: | CN113869529B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 范洺源;陈岑;王力 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/094 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 童磊;徐焕 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 对抗 样本 方法 模型 评估 装置 计算机 设备 | ||
本说明书实施例公开了一种用于生成第一自然样本的对抗样本的方法、模型评估方法、装置和计算机设备。所述用于生成第一自然样本的对抗样本的方法包括:获取第一对抗样本,所述第一对抗样本的标签与第一自然样本不同;使第一对抗样本接近第一自然样本,直至第一对抗样本与第一自然样本之间的相似程度满足条件并且第一对抗样本的标签与第一自然样本不同;将新的第一对抗样本确定为第一自然样本的对抗样本。本说明书实施例可以生成具有较强攻击性的对抗样本,另外,还可以全面地评估机器学习模型的对抗训练效果。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种用于生成第一自然样本的对抗样本的方法、模型评估方法、装置和计算机设备。
背景技术
机器学习的迅猛发展使得机器学习模型在各种各样的业务场景得到广泛应用。然而,机器学习模型非常容易受到对抗样本的攻击。所述对抗样本通过在自然样本中添加干扰得到。通过对抗样本可以使机器学习模型以高置信度给出错误的输出。
通过对机器学习模型进行对抗训练,可以提高机器学习模型的鲁棒性,抵御攻击。为了评估机器学习模型的对抗训练效果,需要生成具有较强攻击性的对抗样本。
发明内容
本说明书实施例提供一种用于生成第一自然样本的对抗样本的方法、模型评估方法、装置和计算机设备,可以生成具有较强攻击性的对抗样本,另外,还可以对机器学习模型的对抗训练效果进行评估。
本说明书实施例的第一方面,提供了一种用于生成第一自然样本的对抗样本的方法,包括:
获取第一对抗样本,所述第一对抗样本的标签与第一自然样本不同;
使第一对抗样本接近第一自然样本,直至第一对抗样本与第一自然样本之间的相似程度满足条件并且第一对抗样本的标签与第一自然样本不同;
将新的第一对抗样本确定为第一自然样本的对抗样本。
本说明书实施例的第二方面,提供了一种模型评估方法,包括:
根据若干数量的自然样本,确定模型的第一性能指标;
根据若干数量的对抗样本,确定模型的第二性能指标;
将第一性能指标与第二性能指标进行融合,得到复合性能指标,所述复合性能指标用于评估模型的对抗训练效果。
本说明书实施例的第三方面,提供了一种用于生成第一自然样本的对抗样本的装置,包括:
获取模块,用于获取第一对抗样本,所述第一对抗样本的标签与第一自然样本不同;
接近模块,用于使第一对抗样本接近第一自然样本,直至第一对抗样本与第一自然样本之间的相似程度满足条件并且第一对抗样本的标签与第一自然样本不同;
确定单元,用于将新的第一对抗样本确定为第一自然样本的对抗样本。
本说明书实施例的第四方面,提供了一种模型评估装置,包括:
第一确定模块,用于根据若干数量的自然样本,确定模型的第一性能指标;
第二确定模块,用于根据若干数量的对抗样本,确定模型的第二性能指标;
融合模块,用于将第一性能指标与第二性能指标进行融合,得到复合性能指标,所述复合性能指标用于评估模型的对抗训练效果。
本说明书实施例的第五方面,提供了一种计算机设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面或者第二方面所述方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111456965.8/2.html,转载请声明来源钻瓜专利网。