[发明专利]一种信贷变量数据的进行高纬变量筛选的方法在审
申请号: | 202111494508.8 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114119211A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 钟磊;田羽;刘银龙;段笑;游江珊 | 申请(专利权)人: | 武汉众邦银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F17/18 |
代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 李龙 |
地址: | 432200 湖北省武汉市黄陂区盘龙城经济开发区汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信贷 变量 数据 进行 筛选 方法 | ||
1.一种信贷变量数据的进行高纬变量筛选的方法,其特征在于,包括以下步骤:
步骤1、获取用户所有相关的信贷变量数据,所述信贷变量数据包括申请数据、放款数据、逾期数据、征信数据,其中,对征信数据进行标签标记,标签包括正常还款客户和违约客户,将信贷变量数据保存为矩阵格式,得到信贷数据集F1=[x1,x2,……,xn],其中x表示信贷数据变量,下标n表示信贷数据变量的个数;
步骤2、截取一段时间信贷变量数据用于变量筛选提取,首先采用cumauc归纳算法对信贷变量数据进行信贷数据特征变量筛选,挑选稳定有效变量,得到新的信贷数据F2=[x1,x2,……,xn];
步骤3、对数据集F2进行卡方分箱,得到最新的信贷数据F3=[x1,x2,……,xm]
其中下标m表示的是经过卡方分箱计算筛选后的信贷数据变量的个数;
步骤4、对信贷数据集F3=[x1,x2,……,xn]进行stepwise逐步回归,得到新的数据集变量,根据最终筛选得到的数据集变量,进行信用评分建模。
2.根据权利要求1所述的一种信贷变量数据的进行高纬变量筛选的方法,其特征在于,步骤2包括以下步骤:
步骤2.1、计算信贷数据集F1中所有的信贷数据单个数据拟合后的auc,取auc值最大的特征数据;
步骤2.2、在步骤2.1的基础上再次新增一个对应的信贷数据,即2个变量组合后的auc,取auc最大的的特征数据;
步骤2.3、重复2.2的动作,直到auc不增加幅度不满足标准,即完成cumauc的变量筛选,即筛选后的信贷数据变量集为F2=[x1,x2,……,xw];
通过从信贷数据单变量的筛选到多变量的组合筛选,筛选出稳定最有效的信贷数据变量。
3.根据权利要求1所述的一种信贷变量数据的进行高纬变量筛选的方法,其特征在于,
步骤3包括以下步骤:
步骤3.1:根据信贷变量数据F2中的每一个变量预设一个卡方的阈值;
步骤3.2:对每一个单独的信贷数据变量初始化,根据离散的属性对每一个实例进行排序,每个实例属于一个区间;
步骤3.3:计算每一个相邻区间的卡方值,将卡方值最小的一对区间合并;
步骤3.4:根据分箱结果计算每一箱客户的贷后表现,筛选贷后表现符合单调性的信贷变量数据F3。
4.根据权利要求1所述的一种信贷变量数据的进行高纬变量筛选的方法,其特征在于步骤4包括以下步骤:
步骤4.1、根据信贷数据变量集F3=[x1,x2,……,xm]建立每个信贷数据自变量与因变量的一元回归方程:y=aixi+bi,i=1,2,…,n,其中ai代表的是每个信贷数据建立的一元回归方程的系数,bi的代表的是每个信贷数据建议的一元回归方程的截距;
步骤4.2、分别计算m个一元回归方程中的回归系数ai的检验统计量F,并求出最大值为若停止筛选,否则将对应的信贷数据变量xk1加入变量集合,此时可以将xk1看作x1进入步骤4.3,其中一元回归方程的单侧检验结果,下标m表示所有参与卡方分箱的信贷数据变量的数量,xk1是符合条件的信贷数据变量,Fa是F检验函数,1是分子自由度,n-2是分母自由度;
步骤4.3、分别将自变量(x1,x2),(x1,x3),...,(x1,x2)与因变量建立二元回归方程,此时x1是步骤4.2中的xk1,计算方程中x2,x3,...,xm是回归系数检验统计量F,取若则停止筛选,否则将xk2选入变量集,此时将xk2看作x2,依次迭代,直到自变量的最大的F值小于临界值。
其中在本步骤中建立的二元回归方程中,二元回归方程的单侧检验结果,下标m表示所有参与卡方分箱二元回归方程的信贷数据变量的数量,xk2是符合二元回归方程条件的信贷数据变量,Fa是F检验函数,1是分子自由度,n-2-1是分母自由度。
最终的信贷数据变量集就是筛选出来的变量集F4=[x1,x2,……,xn]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉众邦银行股份有限公司,未经武汉众邦银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111494508.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置