[发明专利]对抗样本生成模型的训练方法及装置有效
申请号: | 202110656184.7 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113222480B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 李辉;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q10/04;G06N20/00;G06F18/241 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对抗 样本 生成 模型 训练 方法 装置 | ||
本说明书实施例提供一种生成对抗样本的生成模型的训练方法和装置,该方法包括,首先获取原始样本构成的样本集,其中包括正常样本和风险样本;还获取风险检测模型及其对应的损失函数。针对样本集中各个原始样本,利用生成模型生成扰动变换,并将其叠加在对应原始样本上,得到各个原始样本对应的各个变换样本;利用风险检测模型确定各个变换样本的各个风险预测值;以正常样本对应的标签值为比对标签值,分别将各个风险预测值代入前述损失函数,得到各个变换样本的对抗损失;至少根据各个变换样本的对抗损失的综合确定总对抗损失;以最小化总对抗损失为目标,调整生成模型中的参数。
技术领域
本说明书一个或多个实施例涉及机器学习领域,尤其涉及对抗样本生成模型的训练方法和装置。
背景技术
机器学习的迅猛发展使得各种机器学习的模型在各种各样的业务场景得到应用。例如在安全和风控场景中,已经通过机器学习训练出一些风险检测模型,用于识别出有风险或有安全隐患的对象。例如,通过风险检测模型识别垃圾账号,识别高风险的交易,识别高风险操作,等等。在识别出这样的风险对象后往往会对其进行拦截,以确保系统和用户的安全。
鉴于已有的风险检测模型常常在鲁棒性方面存在不足,希望能有改进的方案,可以针对风险检测模型进行优化,以提升其鲁棒性,更好地适用于风险检测场景中的攻防特点。
发明内容
本说明书一个或多个实施例描述了一种对抗样本生成模型的训练方法和装置,可以模拟攻击者的攻击过程生成对抗样本,从而可以利用这样的对抗样本,从攻防对抗的角度对风险检测模型进行优化,增强其鲁棒性和安全性。
根据第一方面,提供了一种用于生成对抗样本的生成模型的训练方法,包括:
获取原始样本构成的样本集,其中包括正常样本和风险样本;
获取风险检测模型及其对应的损失函数,所述风险检测模型为生成模型所所针对的模型;
针对所述样本集中各个原始样本,利用所述生成模型生成扰动变换,并将其叠加在对应原始样本上,得到各个原始样本对应的各个变换样本;
利用所述风险检测模型确定所述各个变换样本的各个风险预测值;
以正常样本对应的标签值为比对标签值,分别将所述各个风险预测值代入所述损失函数,得到各个变换样本的对抗损失;
至少根据所述各个变换样本的对抗损失的综合确定总对抗损失;
以最小化总对抗损失为目标,调整所述生成模型中的参数。
在一个实施例中,所述各个变换样本包括,原始风险样本对应的变换风险样本,和原始正常样本对应的变换正常样本;相应的,至少根据所述各个变换样本的对抗损失的综合确定总对抗损失,包括:根据各个变换风险样本的对抗损失之和,确定第一损失项;根据各个变换正常样本的对抗损失之和,确定第二损失项;根据第一损失项和第二损失项的组合,确定所述总对抗损失。
进一步的,在一个实施例中,确定第一损失项,包括:根据各个变换风险样本的对抗损失之和,以及各个变换风险样本对应的扰动变换的大小度量值之和,确定所述第一损失项;确定第二损失项,包括:根据各个变换正常样本的对抗损失之和,以及各个变换正常样本对应的扰动变换的大小度量值之和,确定所述第二损失项。
在具体例子中,所述扰动变换的大小度量值可以是,所述扰动变换的二阶范数,或者二阶范数的平方。
在一个进一步的实施例中,根据第一损失项和第二损失项的组合,确定所述总对抗损失,具体为:根据所述第一损失项和第二损失项的加权求和,得到所述总对抗损失。。
在不同例子中,所述样本为以下之一:账号、交易、文本片段、用户操作。
根据第二方面,提供了一种优化风险检测模型的方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110656184.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理