[发明专利]对抗样本生成模型的训练方法及装置有效
申请号: | 202110656184.7 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113222480B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 李辉;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q10/04;G06N20/00;G06F18/241 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对抗 样本 生成 模型 训练 方法 装置 | ||
1.一种用于生成对抗样本的生成模型的训练方法,包括:
获取原始样本构成的样本集,其中包括正常样本和风险样本,所述原始样本由业务对象构成,所述业务对象为账号、交易或文本,所述业务对象为账号时,所述原始样本的样本特征包括如下至少之一:账号的注册时长、注册信息、最近一段时间的使用频次、发表评论的频次;所述业务对象为交易时,所述原始样本的样本特征包括如下至少之一:交易金额、交易时间、支付渠道、交易双方属性信息;所述业务对象为文本时,所述原始样本的样本特征包括如下至少之一:文本中的字符、文本发布时间、来源;
获取风险检测模型及其对应的损失函数,所述风险检测模型为生成模型所针对的模型,用于识别有风险或有安全隐患的业务对象;
针对所述样本集中各个原始样本的样本特征,利用所述生成模型生成扰动变换,并将其叠加在对应原始样本的样本特征上,得到各个原始样本对应的各个变换样本的样本特征;
利用所述风险检测模型处理所述各个变换样本的样本特征,得到对应的各个风险预测值;
以正常样本对应的标签值为比对标签值,分别将所述各个风险预测值代入所述损失函数,得到各个变换样本的对抗损失;
至少根据所述各个变换样本的对抗损失的综合确定总对抗损失;
以最小化总对抗损失为目标,调整所述生成模型中的参数;
利用训练完成的生成模型生成对抗样本的样本特征,所述对抗样本的样本特征用于更新所述风险检测模型,使得风险检测模型仍将风险样本对应的对抗样本识别为风险样本。
2.根据权利要求1所述的方法,其中,所述各个变换样本包括,原始风险样本对应的变换风险样本,和原始正常样本对应的变换正常样本;
至少根据所述各个变换样本的对抗损失的综合确定总对抗损失,包括:
根据各个变换风险样本的对抗损失之和,确定第一损失项;
根据各个变换正常样本的对抗损失之和,确定第二损失项;
根据第一损失项和第二损失项的组合,确定所述总对抗损失。
3.根据权利要求2所述的方法,其中,
确定第一损失项,包括:
根据各个变换风险样本的对抗损失之和,以及各个变换风险样本对应的扰动变换的大小度量值之和,确定所述第一损失项;
确定第二损失项,包括:
根据各个变换正常样本的对抗损失之和,以及各个变换正常样本对应的扰动变换的大小度量值之和,确定所述第二损失项。
4.根据权利要求3所述的方法,其中,所述扰动变换的大小度量值为,所述扰动变换的二阶范数,或者二阶范数的平方。
5.根据权利要求2或3所述的方法,其中,根据第一损失项和第二损失项的组合,确定所述总对抗损失,包括:
根据所述第一损失项和第二损失项的加权求和,得到所述总对抗损失。
6.一种优化风险检测模型的方法,所述风险检测模型用于识别有风险或有安全隐患的业务对象,包括:
获取原始样本构成的样本集,其中包括正常样本和风险样本,所述原始样本由业务对象构成,所述业务对象为账号、交易或文本,所述业务对象为账号时,所述原始样本的样本特征包括如下至少之一:账号的注册时长、注册信息、最近一段时间的使用频次、发表评论的频次;所述业务对象为交易时,所述原始样本的样本特征包括如下至少之一:交易金额、交易时间、支付渠道、交易双方属性信息;所述业务对象为文本时,所述原始样本的样本特征包括如下至少之一:文本中的字符、文本发布时间、来源;
获取根据权利要求1的方法训练的生成模型;
对于所述样本集中各个原始样本的样本特征,利用所述生成模型生成扰动变换,并将其叠加在对应原始样本的样本特征上,得到各个原始样本对应的各个变换样本的样本特征;
利用所述样本集中各个原始样本的样本特征对应的原始标签和各个变换样本,更新风险检测模型,使得更新后的风险检测模型仍将风险样本对应的变换样本识别为风险样本;利用所述风险检测模型对待检测的业务对象进行风险检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110656184.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理