[发明专利]风控特征生成方法及系统在审
申请号: | 202010662194.7 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111861704A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 林建明 | 申请(专利权)人: | 深圳无域科技技术有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 上海大邦律师事务所 31252 | 代理人: | 孙成 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 生成 方法 系统 | ||
1.一种风控特征生成方法,其特征在于,所述生成方法包括:
步骤S1、对风控特征数据进行筛选,筛选出数据质量、接入时间及数据稳定性达到设定条件的风控特征;
步骤S2、获取风控模型,根据获取的风控模型得到其对风控特征数据统计学特性及数据内在特性的要求;
步骤S3、获取需要达到的指标数据,根据需要达到的指标数据对风控特征数据进行筛选,选取预测能力满足设定条件的风控特征数据;
步骤S4、获取特征间相关性数据,选择相关性低于设定阈值的特征;通过两两变量间的相关性以及衡量特征多重共线性程度的方差膨胀系数;不同算法对特征间相关性要求不一样,通过相关性选择特征需要根据算法区别对待;
两两相关性计算公式为:
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差;
方差膨胀系数公式为:
其中,R2是某个特征与其余特征之间的判定系数;
步骤S5、获取最优特征组合,通过逐步回归、递归特征消除的算法得到最优特征组合;同时使用逐步回归、递归特征消除的算法获取最优特征组合,最终根据特征组合的模型效果选择出最终特征组合;
逐步回归的处理方式包括:将特征逐一放入模型中,在引入特征时需要利用偏回归平方和进行检验,当显著时才加入该特征;当方程加入该特征后,对原有的特征重新用偏回归平方和进行检验,一旦特征不显著便删除该特征;如此下去,直到老特征不可删除,新特征也无法加入为止;
递归特征消除是一种寻找最优特征子集的贪心算法,主要的思路是:反复地构建模型,根据系数选出最好的或者最差的特征,然后在剩余的特征上重复这个过程,直到所有特征都遍历;这个过程中特征被消除的次序就是特征的排序。
2.一种风控特征生成方法,其特征在于,所述生成方法包括:
步骤S1、对风控特征数据进行筛选,筛选出数据质量、接入时间及数据稳定性达到设定条件的风控特征;
步骤S2、获取风控模型,根据获取的风控模型得到其对风控特征数据统计学特性及数据内在特性的要求;
步骤S3、获取需要达到的指标数据,根据需要达到的指标数据对风控特征数据进行筛选,选取预测能力满足设定条件的风控特征数据;
步骤S4、获取特征间相关性数据,选择相关性低于设定阈值的特征;
步骤S5、获取最优特征组合,通过逐步回归、递归特征消除的算法得到最优特征组合。
3.根据权利要求2所述的风控特征生成方法,其特征在于:
通过两两变量间的相关性以及衡量特征多重共线性程度的方差膨胀系数;不同算法对特征间相关性要求不一样,通过相关性选择特征需要根据算法区别对待;
两两相关性计算公式为:
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差;
方差膨胀系数公式为:
其中,R2是某个特征与其余特征之间的判定系数。
4.根据权利要求2所述的风控特征生成方法,其特征在于:
步骤S4中,逐步回归的处理方式包括:将特征逐一放入模型中,在引入特征时需要利用偏回归平方和进行检验,当显著是才加入该特征;当方程加入该特征后,又要对原有的特征重新用偏回归平方和进行检验,一旦特征不显著便删除该特征;如此下去,直到老特征不可删除,新特征也无法加入为止;
递归特征消除的处理方式包括:寻找最优特征子集的贪心算法,反复地构建模型然后选出最好的或者最差的的特征,然后在剩余的特征上重复这个过程,直到所有特征都遍历了;这个过程中特征被消除的次序就是特征的排序。
5.根据权利要求2所述的风控特征生成方法,其特征在于:
所述步骤S1中,选择数据源接入时间早于设定阈值、数据源的稳定性高于设定阈值的风控特征数据;
所述步骤S2中,选择特征缺失率低于50%,psi、单一值占比低于设定阈值,且未经过逻辑转换的风控特征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳无域科技技术有限公司,未经深圳无域科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010662194.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耗材开关盖结构
- 下一篇:金融风控逻辑回归特征筛选方法及系统