[发明专利]一种评分卡创建方法、装置和电子设备在审
申请号: | 202011049938.4 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112232944A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 张晓强 | 申请(专利权)人: | 中诚信征信有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;高莺然 |
地址: | 100011 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评分 创建 方法 装置 电子设备 | ||
1.一种评分卡创建方法,其特征在于,包括:
获取多个样本用户的多个样本特征的数据,每个样本用户的多个样本特征的数据包括:该样本用户的行为数据和属性数据;每个样本用户对应存在一个标签,该标签用于表征样本用户是否为高风险用户;
针对每一种样本特征,基于该样本特征的各个特征值,训练获得该样本特征对应的一个或多个回归树;每个回归树包括两个叶子节点,分别表示:以该回归树对应的特征值所划分的样本特征的两个数值区间;
按照各个回归树对应的特征值从小到大的顺序,对同一样本特征所对应的回归树进行排序;并将排序后的第一个回归树的左侧叶子节点表示的数值区间、排序后的最后一个回归树的右侧叶子节点表示的数值区间以及不同回归树的相邻两个叶子节点表示的数值区间的交集均确定为目标数值区间;
将每个目标数值区间作为一个回归树分箱,创建包括各个回归树分箱的评分卡。
2.根据权利要求1所述的方法,其特征在于,所述针对每一种样本特征,基于该样本特征的各个特征值,训练获得该样本特征对应的一个或多个回归树的步骤,包括:
针对样本用户的每一个样本特征,以该样本特征的数据为特征值,针对该样本特征的每一个特征值,基于梯度提升算法确定出以该特征值为分界点的回归树;回归树的每个叶子节点分别对应一个预测分数,表示:该样本特征的数据位于该叶子节点表示的数值区间时所对应的分数;
分别确定以每一个特征值为分界点的各个回归树的增益函数;
从各个回归树中选择增益函数最大的回归树,作为当前所确定的回归树;
获得样本用户的各个样本特征的数据在当前所确定的回归树的预测分数之和,作为输出分数;
基于样本用户的标签和所述输出分数,确定当前的待训练梯度提升树模型的损失函数;当前的待训练梯度提升树模型包括:当前所确定的一个或多个回归树;
判断所述损失函数是否收敛;
若是,固定当前的待训练梯度提升树模型的参数,得到目标梯度提升树模型;
若否,针对样本用户的每一个样本特征的每一个特征值,基于梯度提升算法重新确定出以该特征值为分界点的回归树,并返回所述分别确定以每一个特征值为分界点的各个回归树的增益函数的步骤;
提取目标梯度提升树模型的各个回归树的参数,并将表示同一样本特征数据的同一特征值的多个回归树进行合并,得到每个样本特征对应的一个或多个回归树。
3.根据权利要求2所述的方法,其特征在于,所述将每个目标数值区间作为一个回归树分箱,创建包括各个回归树分箱的评分卡的步骤,包括:
获得每个目标数值区间对应的分数,每个目标数值区间对应的分数为:数值区间与该目标数值区间存在交集的各个叶子节点对应的预测分数之和;
将每个目标数值区间作为一个回归树分箱,并将目标数值区间对应的分数作为该回归树分箱的评分,创建包括各个回归树分箱以及各个回归树分箱所对应的评分的评分卡;其中,评分卡的评分包括各个回归树分箱对应的评分和预设的基础分。
4.根据权利要求3所述的方法,其特征在于,针对每个目标数值区间,采用如下公式确定该目标数值区间对应的分数:
Score=-B{f1+f2+…+fK}
其中,Score表示该目标数值区间对应的分数,B为预设的常数参数,f1、f2、…、fK分别表示数值区间与该目标数值区间存在交集的K个叶子节点对应的预测分数之和。
5.根据权利要求1所述的方法,其特征在于,所述将每个目标数值区间作为一个回归树分箱,创建包括各个回归树分箱的评分卡的步骤,包括:
将每个目标数值区间作为一个特征分箱,采用逻辑回归模型确定每个特征分箱对应的评分,并根据各个特征分箱和各个特征分箱对应的评分创建评分卡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中诚信征信有限公司,未经中诚信征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011049938.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能综合地铁排水沟结构
- 下一篇:混合式密钥存储和管理方法及存储设备