[发明专利]一种基于xgboost的评分卡生成方法、装置及设备在审

专利信息
申请号: 202111494782.5 申请日: 2021-12-08
公开(公告)号: CN114140013A 公开(公告)日: 2022-03-04
发明(设计)人: 陈玮;刘德彬;黄远江;陈颖 申请(专利权)人: 重庆誉存大数据科技有限公司
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q40/02;G06K9/62
代理公司: 重庆智慧之源知识产权代理事务所(普通合伙) 50234 代理人: 余洪
地址: 401121 重庆市渝北*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 xgboost 评分 生成 方法 装置 设备
【说明书】:

发明提供一种基于xgboost的评分卡生成方法、装置及设备,通过对获取的各客户信息进行预处理,得到初始数据;并对初始数据进行分箱处理,计算各分箱的woe值;对每个分箱中的初始数据进行woe转换,得到目标变量;建立xgboost分类模型,输入目标变量,确定各目标变量的权重;再根据初始数据,计算信用分值,结合目标变量的权重,确定分箱的重要程度;根据重要程度,从而得到标准形式的评分卡。基于xgboost模型,满足对数据处理的高要求,基于变量分箱的重要程度从而得到评分卡,实现对多重非线性的关系的处理,解决了逻辑回归模型的缺陷,能够快速地应用到信贷评分领域,对客户进行客观科学地评分,拦截坏客户。

技术领域

本发明涉及评分卡生成技术领域,尤其涉及一种基于xgboost的评分卡生成方法、装置及设备。

背景技术

目前,信用评分卡广泛应用在金融科技信贷领域,用于综合评估客户信用风险,为贷前预授信、贷中行为评分、贷后催收以及防欺诈等决策提供科学支撑,是现代金融模型的核心之一。常见的实现方式是根绝申请客户的各项数据进行WOE分箱,建立逻辑回归模型,然后进行刻度转换,根据回归系数以及WOE值对每箱赋予分数,得到初步的评分卡,再根据业务背景进行一定的调整得到最终的评分卡。逻辑回归由于是一种线性模型,无法考虑到变量之间的以及变量与违约风险之间的非线性关系,而真实场景中大量的关系都表现为非线性关系,逻辑回归模型对于这种非线性关系捕捉能力不足,因此预测效果相对较差。

发明内容

基于此,有必要针对上述技术问题,提供一种基于xgboost的评分卡生成方法、装置及设备。

本案中的xgboost是一种基于boosting集成方式的以CART决策树作为基础学习器的梯度提升算法的高效实现,该算法能够自动选择那些重要的变量,对变量的重要性进行排序,量化变量的重要程度,同时具有强大的非线性捕捉能力,此外对于一些效果类似的变量,xgboost会自动地选择其中最具代表性的变量,将其放在重要的位置,而忽视其余的可替代变量,因此具有很强的处理多重共线性的能力。本案根据xgboost得出的各个变量的重要性程度,然后再转化为标准的评分表,即解决了逻辑回归模型的缺陷,同时又有逻辑回归模型的可解释性,因此xgboost是一种逻辑回归模型很好的替代模型。

一种基于xgboost的评分卡生成方法,所述方法包括:获取各客户信息,对所述各客户信息进行预处理,得到初始数据;对所述初始数据进行分箱处理,并计算各分箱的woe值;对每个分箱中的初始数据进行woe转换,得到目标变量;建立xgboost分类模型,输入所述目标变量,确定各目标变量的权重;根据初始数据,计算信用分值,结合所述目标变量的权重,确定目标变量对应分箱的重要程度;根据各目标变量对应分箱的所述重要程度,得到标准形式的评分卡。

在其中一个实施例中,所述获取各客户信息,对所述各客户信息进行预处理,得到初始数据步骤,具体为:获取各客户信息;对所述各客户信息进行缺失值填充和非法值替换处理,得到初始数据。

在其中一个实施例中,所述根据初始数据,计算信用分值,结合所述目标变量的权重,确定目标变量对应分箱的重要程度步骤,具体为:根据所述初始数据建立马尔科夫转移矩阵,确定信用系数;统计各所述目标变量的分箱中好坏客户的频数;将所述频数作为加权值,对所述信用系数进行加权求和,得到各分箱的信用分值;根据所述信用分值和各所述目标变量的权重,确定各目标变量对应分箱的重要程度。

在其中一个实施例中,所述统计各所述目标变量的分箱中好坏客户的频数步骤,具体为:根据客户信息,将所述目标样本分为好样本和坏样本;将所述各分箱中的目标样本根据好样本和坏样本进行区分统计,得到各所述目标变量的分箱中好坏客户的频数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆誉存大数据科技有限公司,未经重庆誉存大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111494782.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top