[发明专利]融合多种机器学习模型的征信评分方法及系统在审
申请号: | 201911081115.7 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110956273A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 陈浩锐;欧达城;杨正宇;林春;周芮琦;剧建军 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q40/02 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100010 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 多种 机器 学习 模型 评分 方法 系统 | ||
1.一种融合多种机器学习模型的征信评分方法,其特征在于,包括:
步骤1,清洗客户数据,对数据缺失值进行处理,特征组合并序列化,并根据不同的数据特点进行切分,作为五个子模型的样本;
步骤2,基于用户在收入、经营成本、风险成本、交易表现、产品购买表现等维度的综合表现,完成模型目标定义;
步骤3,利用步骤1的样本数据,并基于步骤2定义的模型目标训练五个子模型数据,得到五个子模型,所述五个子模块包括:身份特质、履约能力、行为偏好、信用历史和社会属性;
步骤4,对步骤3的五个子模型,基于子模型与模型目标的皮尔逊相关系数进行加权融合,建立征信综合评分模型,进行训练和预测;
步骤5,对最终模型结果0-1标准化处理,并对每个客户划分评价等级。
2.根据权利要求1所述的融合多种机器学习模型的征信评分方法,其特征在于,所述步骤1采用hadoop分布式系统基础架构进行数据处理。
3.根据权利要求1所述的融合多种机器学习模型的征信评分方法,其特征在于,所述步骤3中,建立身份特质模型,采用逻辑回归算法进行模型构建。
4.根据权利要求1所述的融合多种机器学习模型的征信评分方法,其特征在于,所述步骤3中,建立履约能力模型,采用随机森林算法进行模型构建。
5.根据权利要求1所述的融合多种机器学习模型的征信评分方法,其特征在于,所述步骤3中,建立行为偏好模型,采用GBDT算法进行特衍生,并采用逻辑回归算法进行模型构建,并与用户的交易表现、产品购买表现、活跃度基于RFM模型的实现思路进行组合区隔,完成行为偏好模型构建。
6.根据权利要求1所述的融合多种机器学习模型的征信评分方法,其特征在于,所述步骤3中,建立社会属性模型,采用关系网络算法,以用户朋友圈一度好友与二度好友在步骤3所述四个子模型上的评分表现,作为用户社会属性子模型评分。
7.根据权利要求1所述的融合多种机器学习模型的征信评分方法,其特征在于,所述步骤3中,建立信用历史模型,采用标准评分卡模型方式实现。
8.一种融合多种机器学习模型的征信评分系统,其特征在于,包括:
数据清洗模块,用于对数据缺失值进行处理,特征组合并序列化,并根据不同的数据特点进行切分;
模型目标定义模块,基于用户在收入、经营成本、风险成本、交易表现、产品购买表现等维度的综合表现,完成模型目标的定义;
子模型创立模块,通过利用样本数据并基于模型目标训练五个子模型数据,得到五个子模型的创立,子模型包括身份特质、履约能力、行为偏好、信用历史和社会属性;
子模型训练模块,基于子模型与模型目标的皮尔逊相关系数进行加权融合,对创立的五个子模型,建立征信综合评分模型,进行训练和预测;以及
标准化处理模块,用于对最终模型结果分数进行映射处理,将客户划分成若干评价等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911081115.7/1.html,转载请声明来源钻瓜专利网。