[发明专利]一种评分卡的融合方法、装置、计算机设备及存储介质有效
申请号: | 202010705871.9 | 申请日: | 2020-07-21 |
公开(公告)号: | CN112037005B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 黄馨;李怡文 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评分 融合 方法 装置 计算机 设备 存储 介质 | ||
本发明公开一种评分卡的融合方法、装置、计算机设备及存储介质,属于风险控制技术领域。方法包括:获取专家评分卡和机器学习评分卡,其中,专家评分卡使用的特征变量和机器学习评分卡所使用的特征变量不同;对专家评分卡与机器学习评分卡在多个权重组合上分别进行融合,得到多个融合评分卡;使用验证样本对多个融合评分卡进行验证,筛选出最优的融合评分卡。相比于现有技术直接将专家挑选的变量加入机器学习模型,重复这个过程直到选出符合模型条件的变量,本发明不但能够避免重复工作量较大的问题,而且能够有效避免样本数据偏差问题,提升了模型预测能力。
技术领域
本发明涉及风险控制技术领域,尤其涉及一种评分卡的融合方法、装置、计算机设备及存储介质。
背景技术
在风险控制技术领域中,以金融领域的信贷风险控制为例,金融机构通常需要构建风控模型对业务对象进行信用风险评测,在针对业务对象进行信用风险评测时,可以在风控模型中使用评分卡对业务对象进行信用评分,评分越高,对应的信用风险越低,反之亦然。
评分卡可以分为专家评分卡和机器评分卡,在产品积累了大量样本数据的情形下,可以直接使用机器学习建模。但在产品没有足够的数据量建模,或者新的产品没有数据积累时(无监督学习),通常会选择使用专家评分卡。无论是机器学习评分卡还是专家卡,它们在单独使用时都有一定的局限性。机器学习对数据依赖性非常强,一旦样本发生偏差,那么会直接影响到模型的预测能力,同时,建模数据通常具有滞后性,不能对近期的策略和前端业务调整作出及时的反应,模型上线后对当前的客户预测能力会比建模时下降。专家评分卡在一定程度上解决了数据的问题,并且可解释性较强,对于字符型字段和非连续型数值字段的处理更加简单有效,但主观性太强,不具有可复制性。
目前,很多风控评分卡会将专家经验融入到机器学习中,通常做法是直接将专家挑选的变量加入机器学习模型,重复这个过程直到选出符合模型条件的变量。以逻辑回归为例,在回归式中直接加入新变量可能会导致某个变量的显著性降低,直接反映为变量p值变大,超过阈值,那么就要对加进去的变量进行更换,直到选出合适的变量组合为止,这种方法为了保证模型指标符合要求,重复工作量较大,并且专家挑选的变量在选定建模的数据上不一定有很强的预测能力(通常表现为IV值较低),以机器学习模型的变量要求来衡量专家经验变量,本身就存在一定的矛盾。
发明内容
为了解决上述背景技术中提到的问题,本发明实施例的目的在于提供一种评分卡的融合方法、装置、计算机设备及存储介质。
本发明实施例提供的具体技术方案如下:
第一方面,提供了一种评分卡的融合方法,所述方法包括:
获取专家评分卡和机器学习评分卡,其中,所述专家评分卡使用的特征变量和所述机器学习评分卡所使用的特征变量不同;
对所述专家评分卡与所述机器学习评分卡在多个权重组合上分别进行融合,得到多个融合评分卡;
使用验证样本对多个所述融合评分卡进行验证,筛选出最优的融合评分卡。
进一步地,所述获取专家评分卡和机器学习评分卡,包括:
构建训练样本集和特征变量库,所述训练样本集包括正样本和负样本;
根据专家经验法从所述特征变量库中筛选多个特征变量以创建专家评分卡;
从所述特征变量库中剔除筛选出的所有所述特征变量,得到剩余特征变量;
根据所述剩余特征变量在所述训练样本集上进行机器学习,以创建机器学习评分卡。
进一步地,从所述特征变量库中剔除筛选出的所有所述特征变量,得到剩余特征变量步骤之后,所述方法还包括:
对筛选出的所有所述特征变量与每一个所述剩余特征变量进行相关性检验;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010705871.9/2.html,转载请声明来源钻瓜专利网。