[发明专利]一种应用迁移学习进行个人信用风险预测方法及系统在审
申请号: | 202111461117.6 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114186831A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 毛正冉;卫浩 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/02;G06K9/62;G06N20/20 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用 迁移 学习 进行 个人 信用风险 预测 方法 系统 | ||
本发明公开了一种应用迁移学习进行个人信用风险预测方法及系统,属于金融风险评估技术领域,解决现有的应用迁移学习技术的金融信用风险预测模型在训练元模型时使用了全体样本,当其中存在与目标领域样本分布不同的样本时,会出现负迁移与过拟合效应,导致在目标领域样本上微调优化的模型效果不佳的问题。本发明中对元模型的建模样本进行筛选,挑选出与目标领域同分布的样本建立元模型,再使用该模型在目标领域的小规模样本上进行微调优化,通过优化元模型训练样本与目标领域小规模样本的数据分布差异,避免异分布样本导致的负迁移和过拟合效应,降低元模型训练样本规模,并提高元模型训练与目标领域模型微调效率。
技术领域
本发明属于金融风险评估技术领域,具体涉及一种应用迁移学习进行个人信用风险预测方法及系统。
背景技术
随着经济的发展,金融业越来越发达,其中,贷款作为金融业务的一项重要组成部分,贷款业务种类越来越繁荣,贷款渠道也越来越丰富。人们的生活、生产活动中,小到个人的日常消费,大到企业的生产经营,都离不开贷款业务。提供贷款服务的金融机构在发放贷款之前,一般都会对该项贷款业务进行信用风险评估,只有当风险符合要求时,才会批准贷款申请。现有的信用风险预测方法,大多是先要确认贷款人的身份,核实贷款人身份的真实性,然后获取贷款人的个人征信信息,再对贷款人的信用等级进行评估,最终决定是否批准贷款申请。现有技术中一般通过建立信用风险预测模型来预测贷款人的信用风险。
传统金融信用风险预测模型(统计与机器学习模型)实现时,一般使用同一客户群体的历史数据(包含已知的客户相关信息与客户的信用标签,且样本数量充足),进行数据处理,特征加工,建立统计与机器学习模型并优化,最终应用于相同业务场景的客户群体中进行个人信用风险预测,最大的特点是训练与预测所使用的客户群体是同分布的,因此可以取得较好的预测效果,但缺点是需要同分布的大量客户样本进行训练,难以应用于不同业务场景的客户群体(尤其是新业务启动阶段,新客户样本与标签均较少时),跨业务场景预测时泛化性能较差。
为了解决上述传统金融信用风险预测模型的缺点,迁移学习逐渐在金融信用风险预测领域得到重视与应用,诞生了应用迁移学习技术的金融信用风险预测模型,此类模型普遍使用不同领域的已有大量样本建立元模型,并在目标领域的小规模样本上微调/迭代优化,此方法的优点是目标领域样本需求量小,一般而言预测的泛化性能较好,缺点是在目标领域样本和已有不同领域大量样本分布差异较大时,直接使用基于所有样本训练的模型进行微调可能会出现负迁移与过拟合效应,导致在目标领域上的泛化性能下降。
发明内容
为了解决上述现有的应用迁移学习技术的金融信用风险预测模型在训练元模型时使用了全体样本,当其中存在与目标领域样本分布不同的样本时,会出现负迁移与过拟合效应,导致在目标领域样本上微调优化的模型效果不佳的问题。本发明对元模型的建模样本进行筛选,选择合适(同分布)的样本建立元模型,再使用该模型在目标领域的小规模样本上进行微调优化,解决了异分布样本导致的负迁移和过拟合效应,还能降低元模型训练样本规模,提高元模型训练与目标领域模型微调的效率。
本发明采用的技术方案如下:
一种应用迁移学习进行个人信用风险预测系统,其具体包括:
第一终端:作为元模型训练样本筛选终端,筛选接近目标领域分布的样本以训练元模型,将筛选的数据输出到第二终端;
第二终端:作为元模型训练终端,接收第一终端的输出数据,训练可适用于目标领域微调建模的元模型,将训练后的元模型输出到第三终端;
第三终端:作为目标领域模型训练终端,接收第二终端输出的元模型,应用元模型输出预测概率结合目标领域的小规模样本训练最终的目标领域模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111461117.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纸板分切装置
- 下一篇:一种人工智能数据处理存储设备及其存储系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理