[发明专利]风险交易识别模型的训练方法、风险交易识别方法和装置有效
申请号: | 202210807503.4 | 申请日: | 2022-07-11 |
公开(公告)号: | CN114912549B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 王宁涛;傅幸;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q40/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 交易 识别 模型 训练 方法 装置 | ||
1.风险交易识别模型的训练方法,包括:
获取黑数据样本和白数据样本;其中,所述黑数据样本的分类标签为风险交易,所述白数据样本的分类标签为非风险交易;
将所述黑数据样本和所述白数据样本输入当前训练的风险交易识别模型,得到各黑数据样本和白数据样本的识别结果;
根据各黑数据样本和白数据样本的识别结果,确定损失函数;其中,所述损失函数能够提高对所述黑数据样本的学习权重;
利用所述损失函数,继续训练所述风险交易识别模型;
所述根据各黑数据样本和白数据样本的识别结果确定损失函数,包括:
利用如下计算式,计算所述损失函数:
其中,L用于表征所述损失函数,y用于表征所述黑数据样本的分类标签所对应的标签值,用于表征当前训练的风险识别模型输出的分类标签为风险交易的概率值,γ用于表征平衡风险交易识别模型对所述黑数据样本和所述白数据样本的关注度的参数;
其中,所述黑数据样本的学习权重为1;
如果数据样本为黑数据样本,那么标签值y=1;如果数据样本为白数据样本,那么标签值y=0。
2.根据权利要求1所述的方法,其中,所述识别结果包括:数据样本的标签为风险交易的概率值;
所述根据各黑数据样本和白数据样本的识别结果确定损失函数,包括:
确定所述白数据样本的第一学习权重;以及,
确定所述黑数据样本的第二学习权重;其中,所述第二学习权重大于所述第一学习权重,且所述第二学习权重满足:对所述风险交易识别模型得到的各个风险交易的概率值进行从高到低的排序,获取排在前N个概率值所对应的N个数据样本,该N个数据样本中所包含的分类标签为风险交易的黑数据样本的数量与输入所述风险交易识别模型的所有黑数据样本的数量的比值大于第一预设阈值;
根据所述第一学习权重和所述第二学习权重确定所述损失函数。
3.根据权利要求2所述的方法,其中,所述确定所述白数据样本的第一学习权重,包括:
获取当前训练的风险识别模型输出的分类标签为风险交易的概率值;
根据所述风险交易的概率值,确定所述第一学习权重。
4.根据权利要求2所述的方法,其中,所述根据所述第一学习权重和所述第二学习权重确定所述损失函数,包括:
以所述第一学习权重作为训练所述黑数据样本的权重值,得到黑样本损失项;
以所述第二学习权重作为训练所述白数据样本的权重值,得到白样本损失项;
计算所述黑样本损失项与所述白样本损失项的和,得到所述损失函数。
5.根据权利要求1所述的方法,其中,γ的值不大于第一参数;其中,所述第一参数为所述白数据样本和所述黑数据样本的数量的比例值取10的对数后所得到的值。
6.根据权利要求1至5中任一所述的方法,其中,所述黑数据样本与所述白数据样本数量的比例值不大于第二预设阈值。
7.风险交易识别方法,包括:
获取待进行风险识别的待识别交易数据;
将所述待识别交易数据输入到所述风险交易识别模型中,得到该风险交易识别模型输出的识别结果;其中,所述风险交易识别模型是利用权利要求1至6中任一项所述的方法训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210807503.4/1.html,转载请声明来源钻瓜专利网。