[发明专利]一种基于随机森林算法的消费信贷场景的风险评估方法在审

专利信息
申请号: 202010784787.0 申请日: 2020-08-06
公开(公告)号: CN112037009A 公开(公告)日: 2020-12-04
发明(设计)人: 江远强;韩璐;李兰 申请(专利权)人: 百维金科(上海)信息科技有限公司
主分类号: G06Q40/02 分类号: G06Q40/02;G06Q30/02;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 201913 上海市崇明区长兴镇潘园公*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 随机 森林 算法 消费信贷 场景 风险 评估 方法
【说明书】:

发明公开了一种基于随机森林算法的消费信贷场景的风险评估方法,包括信息采集模块、数据预处理模块、特征工程模块、模型训练及调参模块、特征重要性评估模块、模型评价与选择模块和模型部署监控模块。有益效果:数据预处理简单、特征工程和模型训练效率高、模型准确率高,将随机森林模型结合互联网金融的消费信贷场景,随机森林根据自身的算法优越性,能更好处理互联网数据的高维稀疏、噪声多和变量冗余的问题,随机森林模型相比其他传统评分卡模型具有更高的风险预测准确率以及稳定性,提升了对信用风险的识别,对互联网金融的消费信贷的实际应用具有一定的参考价值。

技术领域

本发明涉及互联网金融消费信贷行业的风控技术领域,具体来说,涉及一种基于随机森林算法的消费信贷场景的风险评估方法。

背景技术

随着互联网+概念的兴起,以P2P借贷、消费金融、汽车租赁等为代表的互联网金融消费信贷公司如雨后春笋般,但在野蛮生长之后,公司的发展速度和命门都集中在风控上面。传统的风控审核是基于机器学习算法的评分卡模型,包括逻辑回归、决策树、支持向量机和神经网络等,这几类算法解释性强,且简单易于理解,能够直接看到各个特征的权重,也能容易地吸收新的数据来更新模型,所以在GBDT、随机森林、lightGBM等集成算法陆续出现的时候,传统评分卡模型仍然是消费信贷行业风险评估的常用方法。

随着大数据的发展,互联网信贷数据不在局限于申请及征信数据,而更多结合网购消费、网络社交、APP使用行为等第三方数据,整个数据呈现出高维稀疏的特点,传统评分卡模型对于该类互联网数据局限性也比较明显,具体问题及难点有以下几个方面:

数据预处理繁琐:传统评分卡模型对于数据预处理要求极高,针对大量存在数据稀疏或缺失值的样本,为了便于计算,直接进行了删除,数据价值的损失较大;

特征工程困难:传统评分卡模型特征工程复杂,需要对连续型数据离散化处理及特征筛选,对特征根据证据权重(WOE)转换、根据信息价值(IV)大小作特征选择,还需根据变量之间的共线性剔除变量,对于当前大数据风控的高维数据来说,远超出传统风控建模评分卡体系的数据处理能力范围,亟需更前沿的机器学习算法处理;

模型准确率不足:传统评分卡模型的算法属于弱分类器,相比基于多个弱分类器组合的集成算法模型,传统评分卡的单模型缺少模型间的探索与验证,可能存在模型稳定性不足及泛化能力较弱的问题。

针对相关技术中的问题,目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题,本发明提出一种基于随机森林算法的消费信贷场景的风险评估方法,以克服现有相关技术所存在的上述技术问题。

为此,本发明采用的具体技术方案如下:

一种基于随机森林算法的消费信贷场景的风险评估方法,包括信息采集模块、数据预处理模块、特征工程模块、模型训练及调参模块、特征重要性评估模块、模型评价与选择模块和模型部署监控模块,所述信息采集模块通过所述数据预处理模块与所述特征工程模块连接,所述特征工程模块通过所述模型训练及调参模块与所述特征重要性评估模块连接,所述特征重要性评估模块通过所述模型评价与选择模块与所述模型部署监控模块连接。

进一步的,所述基于随机森林算法的消费信贷场景的风险评估方法,包括以下步骤:

建模数据获取:从公司业务系统中按申请月份随机抽取建模样本客户,对于表现不充分(近期申请,坏账率明显低于前期客户)的不平衡样本通过SMOTE(syntheticminority oversampling technique:合成少数过采样技术)获得建模客户,用建模客户的编号作为主键去关联提取建模客户的申请数据、征信数据、APP操作埋点数据及客户授权的第三方数据合并成建模数据集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百维金科(上海)信息科技有限公司,未经百维金科(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010784787.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top