[发明专利]一种应用迁移学习进行个人信用风险预测方法及系统在审
申请号: | 202111461117.6 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114186831A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 毛正冉;卫浩 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/02;G06K9/62;G06N20/20 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用 迁移 学习 进行 个人 信用风险 预测 方法 系统 | ||
1.一种应用迁移学习进行个人信用风险预测系统,其特征在于,具体包括:
第一终端:作为元模型训练样本筛选终端,筛选接近目标领域分布的样本以训练元模型,将筛选的数据输出到第二终端;
第二终端:作为元模型训练终端,接收第一终端的输出数据,训练可适用于目标领域微调建模的元模型,将训练后的元模型输出到第三终端;
第三终端:作为目标领域模型训练终端,接收第二终端输出的元模型,应用元模型输出预测概率结合目标领域的小规模样本训练最终的目标领域模型。
2.根据权利要求1所述的一种应用迁移学习进行个人信用风险预测系统,其特征在于,所述元模型训练样本筛选终端包括:
数据清洗模块:用于对原始变量进行数据清洗,并进行必要的特征加工与衍生,生成结构化的训练数据结构,用于样本筛选模块的筛选模型建模以及后续的样本筛选工作;
样本筛选模块:用于对齐元模型训练样本和目标领域样本的解释变量,并将元模型训练样本和目标领域样本分别进行标记,应用决策树模型进行二分类模型的训练与参数优化,迭代至模型效果收敛,并保存为目标领域样本分布检测模型M1;应用目标领域样本分布检测模型至元模型训练样本,逐一预测样本属于目标领域分布的概率p1,初始化阈值,根据阈值筛选出元模型训练样本中与目标领域样本同分布的样本A。
3.根据权利要求1所述的一种应用迁移学习进行个人信用风险预测系统,其特征在于,所述元模型训练终端包括:
数据清洗模块:对原始变量进行数据清洗,并进行必要的特征加工与衍生,生成结构化的训练数据结构,用于元模型训练模块的模型训练与预测工作;
元模型训练模块:根据第一终端输出的样本A,应用决策树模型进行二分类模型的训练与参数优化,迭代至模型效果收敛,并保存为元模型M2。
4.根据权利要求1所述的一种应用迁移学习进行个人信用风险预测系统,其特征在于,所述目标领域模型训练终端包括:
数据清洗模块:对原始变量进行数据清洗,并进行必要的特征加工与衍生,生成结构化的训练数据结构,用于目标领域模型训练模块的模型训练与预测工作;
目标领域模型训练模块:使用第二终端训练得到的元模型M2对目标领域样本进行预测,得到信用风险预测概率p2,加入到目标领域样本的解释变量中,结合信用风险标签,应用决策树模型进行二分类模型的训练与参数优化,迭代至模型效果收敛,并保存为目标领域信用风险预测模型M3,应用M3对目标领域现有样本以及新加入的无标签样本进行预测得到个人信用风险预测概率p3。
5.一种基于权利要求1-5任一所述的应用迁移学习进行个人信用风险预测系统的个人信用风险预测方法,其特征在于,具体包括:
元模型训练样本数据清洗:系统对原始变量进行数据清洗,并进行必要的特征加工与衍生,生成结构化的训练数据结构;
元模型训练样本筛选:系统对齐元模型训练样本和目标领域样本进行解释变量,并将元模型训练样本和目标领域样本分别进行标记,应用决策树模型进行二分类模型的训练与参数优化,通过计数器对训练过程进行迭代,直至模型效果收敛,并保存为目标领域样本分布检测模型M;应用目标领域样本分布检测模型至元模型训练样本,逐个预测样本属于目标领域分布的概率p1,初始化阈值,根据阈值筛选出元模型训练样本中与目标领域样本同分布的样本A;
元模型训练:系统根据第一终端输出的样本A,应用决策树模型进行二分类模型的训练与参数优化,通过计数器对训练过程进行迭代,直至模型效果收敛,并保存为元模型M2;
目标领域模型训练数据清洗:系统对原始变量进行数据清洗,并进行必要的特征加工与衍生,生成结构化的训练数据结构;
目标领域模型训练:系统使用第二终端训练得到的元模型M2对目标领域样本进行预测,得到信用风险预测概率p2,加入到目标领域样本的解释变量中,结合信用风险标签,应用决策树模型进行二分类模型的训练与参数优化,通过计数器对训练过程进行迭代,直至模型效果收敛,并保存为目标领域信用风险预测模型M3,系统应用M3对目标领域现有样本以及新加入的无标签样本进行预测得到个人信用风险预测概率p3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111461117.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纸板分切装置
- 下一篇:一种人工智能数据处理存储设备及其存储系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理