[发明专利]一种评分卡创建方法、装置和电子设备在审
申请号: | 202011049938.4 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112232944A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 张晓强 | 申请(专利权)人: | 中诚信征信有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;高莺然 |
地址: | 100011 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评分 创建 方法 装置 电子设备 | ||
本发明实施例提供了一种评分卡创建方法、装置和电子设备,上述方法包括:获取多个样本用户的多个样本特征的数据;针对每一种样本特征,基于该样本特征的各个特征值,训练获得该样本特征对应的一个或多个回归树;按照各个回归树对应的特征值从小到大的顺序,对同一样本特征所对应的回归树进行排序;并将排序后的第一个回归树的左侧叶子节点表示的数值区间、排序后的最后一个回归树的右侧叶子节点表示的数值区间以及不同回归树的相邻两个叶子节点表示的数值区间的交集均确定为目标数值区间;将每个目标数值区间作为一个回归树分箱,创建包括各个回归树分箱的评分卡。本发明实施例提供的方法,简化了评分卡的创建过程。
技术领域
本发明涉及数据分析技术领域,特别是涉及一种评分卡创建方法、装置和电子设备。
背景技术
目前,大数据分析技术被应用到各个领域中。例如:在金融领域,可以通过对用户的数据进行分析,来实现风险控制。
具体的,金融机构可以通过对用户的属性数据和行为数据等进行大数据分析,对用户进行信用风险评估。目前,主要是通过所创建的评分卡,利用用户的各种属性和行为数据,例如:年龄属性、性别属性或收入支出等属性数据,以及存取款或支付等行为数据,对用户进行信用评分。这样,金融机构可以根据用户的信用评分决定是否给予用户授信以及授信的额度和利率,从而降低金融交易中的风险。其中,用户的信用评分可以反映用户可能会发生逾期还款或者欺诈的概率,且信用评分越高,用户的信用风险越低。
可见,创建评分卡是进行信用评分的重要环节。参见图1,图1为现有技术的一种评分卡的结构示例图。其中,评分卡100包括:收入变量、年龄变量、性别变量和婚姻状况变量,每个变量可以对应多个特征分箱,每个特征分箱为该变量的一个数据区间,如图1中收入变量对应3个特征分箱:[0,10000)、[10000,50000)和[50000,50000以上),即每个特征分箱均为收入变量的一个数据区间。并且,每个特征分箱对应一个woe(weight of evidence,证据权重)值和一个对应分值,其中,每个特征分箱对应的woe值表示:该特征分箱对应的响应高风险用户和非高风险用户的比值,和所有用户中高风险用户和非高风险用户的比值的差异。且woe值越小该特征分箱对应的用户的违约风险越小;每个特征分箱对应的对应分值表示:用户的某一变量的值在该特征分箱内时所对应的评分。
针对用户,可以根据如图1所示的评分卡100,分析用户各个特征的对应分值,然后将各个特征的对应分值和基础分的和值,作为该用户的信用评分。因此,创建评分卡的过程就是对用户的数据进行大数据分析,计算出各种属性和各种行为各自对应的信用评分。例如,若用户a的性别为男性、年龄为20岁、收入为5000且是未婚状态,针对用户a,可以根据图1所示的评分卡100,确定出:性别为男性的对应分值为1.6,婚姻状况为未婚的对应分值为0.3,年龄为20岁对应特征分箱[20,40)且对应分值为22.7,收入为5000对应特征分箱[0,10000)且对应分值为-7.3。则可以将各个特征的对应分值和基础分的和值:1.6+0.3+22.7+(-7.3)+33.7=51,作为用户a的信用评分。
目前,创建评分卡最常用的是基于逻辑回归的标准评分卡,其是利用用户数据,确定出变量分箱,然后构建逻辑回归模型,确定出评分卡。其中,变量分箱是针对每个变量,确定出该变量的多个数值区间,如图1的评分卡100所示,针对年龄需要确定出如[0,20]、[20,40)、[40,50)和[50,100]多个年龄区间。然而,现有的变量分箱过程需要工程师针对每个特征多次重复操作才能确定出较好的变量分箱,操作比较繁复。
发明内容
本发明实施例的目的在于提供一种评分卡创建方法、装置和电子设备,以简化评分卡创建过程。
为了达到上述目的,本发明实施例提供了一种评分卡创建方法,包括:
获取多个样本用户的多个样本特征的数据,每个样本用户的多个样本特征的数据包括:该样本用户的行为数据和属性数据;每个样本用户对应存在一个标签,该标签用于表征样本用户是否为高风险用户;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中诚信征信有限公司,未经中诚信征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011049938.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能综合地铁排水沟结构
- 下一篇:混合式密钥存储和管理方法及存储设备