[发明专利]业务风险分类器训练方法、装置、设备及存储介质在审

专利信息
申请号: 202010703942.1 申请日: 2020-07-21
公开(公告)号: CN111882426A 公开(公告)日: 2020-11-03
发明(设计)人: 孔繁爽;李新;马思玄;杨恺 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G06Q40/02 分类号: G06Q40/02;G06N20/00;G06K9/62
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 刘飞;周达
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 业务 风险 分类 训练 方法 装置 设备 存储 介质
【说明书】:

本说明书提供了一种业务风险分类器训练方法、装置、设备及存储介质,该方法包括:将业务数据分为第一训练集、第一测试集、第二训练集、第二测试集;用第一训练集生成多个第一子任务;同一负样本在不同第一子任务中的标记不同,且每个第一子任务中的正负样本呈指定占比;用第一子任务和第一测试集对第一学习器进行元训练,获得最优学习参数;用第二训练集生成多个第二子任务,将其分别输入以最优学习参数为参数的第一学习器中,并根据对应输出生成多个子风险分类器;用第二测试集测试多个子风险分类器得到多个预测子结果;组合预测子结果获得风险预测结果。本说明书可在不虚构负例情况下,提高业务风险分类器的召回率和预测准确率。

技术领域

本说明书涉及机器学习技术领域,尤其是涉及一种业务风险分类器训练方法、装置、设备及存储介质。

背景技术

目前一些业务风险分类器(例如银行贷款业务的贷款逾期风险预测等)是基于机器学习得到的。一般地,业务数据中的正样本数量远远超过负样本的数量(即正负样本比例不均衡),在此场景下对初始模型进行机器学习训练时,容易导致负样本训练不充分,从而容易导致训练出的业务风险分类器的召回率(recall)不高。

为解决正负样本比例不均衡的问题,现有技术中一般采用虚构负例数据的方式来增加负样本数量。但是通过虚构生成的负样本不具有可解释性,没有现实意义。而且,这种虚构数据的方式也不符合金融安全规范的规则。因此,导致使用虚构负例数据进行机器学习训练得到的业务风险分类器,实际难以应用金融业的风险分类、预测场景中。因此,如何在不虚构负例数据的前提下,提高业务风险分类器的召回率已成为目前亟待解决的技术问题。

发明内容

本说明书实施方案的目的在于提供一种业务风险分类器训练方法、装置、设备及存储介质,以实现在不虚构负例数据的前提下,提高业务风险分类器的召回率。

为达到上述目的,一方面,本说明书实施方案提供了一种业务风险分类器训练方法,包括:

将获取的业务数据划分为用于元训练的第一训练集、第一测试集,以及用于元测试的第二训练集、第二测试集;

从所述第一训练集中抽样出多个第一子任务;其中,同一个负样本在不同第一子任务中的标记不同,且每个第一子任务中的正、负样本呈指定占比;

利用所述多个第一子任务和所述第一测试集,对第一学习器进行元训练,以获得最优学习参数;

从所述第二训练集中抽样出多个第二子任务,将所述多个第二子任务分别输入以所述最优学习参数为参数的第一学习器中,并根据对应的输出生成多个子风险分类器;

利用所述第二测试集测试所述多个子风险分类器,对应得到多个风险预测子结果;

对所述多个风险预测子结果进行组合,获得风险预测结果。

在本说明书一实施方案中,同一个负样本在不同第二子任务中的标记不同,且每个第二子任务中的正、负样本呈指定占比。

在本说明书一实施方案中,每个所述第一子任务中的每类业务风险类别的数据量与所述第一训练集中的负样本总数正相关;每个所述第二子任务中的每类业务风险类别的数据量与所述第二训练集中的负样本总数正相关。

在本说明书一实施方案中,所述对所述多个风险预测子结果进行组合,获得风险预测结果,包括:

对所述多个风险预测子结果进行多数投票,并根据投票结果确定风险预测结果。

另一方面,本说明书实施方案还提供了一种业务风险分类器训练装置,包括:

数据划分模块,用于将获取的业务数据划分为用于元训练的第一训练集、第一测试集,以及用于元测试的第二训练集、第二测试集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010703942.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top