[发明专利]分布式评分卡模型建立方法在审
申请号: | 201910751422.5 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110648215A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 林逸飞;黄向前;赵音龙;林三吉 | 申请(专利权)人: | 上海新颜人工智能科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 31280 上海申浩律师事务所 | 代理人: | 吕琳琳 |
地址: | 200120 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 分布式评分卡模型建立方法包括:对每一标签变量的样本数据进行分箱为N个样本区间并计算各个相邻区间的卡方值;将最小卡方值对应相邻区间合并为新区间,判断经合并后的区间的个数是否达到目标个数,若是则执行S3,否则执行S4;S3、对合并后的区间计算的各个相邻区间的卡方值进行单调性检验,若为单调则进入S5,否则进入将最小卡方值对应的相邻区间合并为新区间并执行S3;S4、重新计算合并后的各个相邻区间的卡方值并执行S2;S5、判断是否存在区间的样本数据的占比超过设定占比值,若是舍弃该标签变量,否则计算区间的信息征信值,选取信息征信值达到预设要求的标签变量作为目标标签变量,将目标标签变量的样本数据代入模型训练。 | ||
搜索关键词: | 相邻区间 样本数据 合并 目标标签 标签 小卡 模型建立 模型训练 区间计算 样本区间 预设要求 重新计算 单调性 评分卡 分箱 舍弃 单调 检验 | ||
【主权项】:
1.一种分布式评分卡模型建立方法,其特征在于,其包括以下步骤:/nS1、分别对每一标签变量的样本数据进行分箱并将标签变量的样本数据分箱为N个样本区间,计算N个样本区间中各个相邻样本区间的卡方值;/nS2、将计算出的最小卡方值对应的相邻样本区间合并为一个新的样本区间,判断经合并后的所有样本区间的个数是否达到目标个数,若是则执行步骤S3,否则执行步骤S4;/n其中,新的样本区间的下限值为最小卡方值对应的相邻样本区间中的左样本区间的下限值,新的样本区间的上限值为最小卡方值对应的相邻样本区间中的右样本区间的上限值;/nS3、对合并后的所有样本区间计算出的各个相邻样本区间的卡方值进行单调性检验,若为单调性则进入步骤S5,否则进入步骤S6;/nS4、重新计算合并后的所有样本区间中各个相邻样本区间的卡方值,并执行步骤S2;/nS5、判断经单调性检验后的样本区间中是否存在样本区间的样本数据的占比超过一设定占比值,若是进入步骤S7,否则进入步骤S8;/nS6、将计算出的最小卡方值对应的相邻样本区间合并为一个新的样本区间,并执行步骤S3;/nS7、舍弃该标签变量;/nS8、计算经单调性检验后的样本区间的信息征信值;/nS9、选取信息征信值达到预设要求的标签变量作为目标标签变量;/nS10、将目标标签变量的样本数据代入评分卡模型进行模型训练,以获得样本训练后的评分卡模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海新颜人工智能科技有限公司,未经上海新颜人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910751422.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种确定异常账户的方法及装置
- 下一篇:一种风控方法和装置