[发明专利]金融风控逻辑回归特征筛选方法及系统在审
申请号: | 202010662195.1 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111861705A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 林建明 | 申请(专利权)人: | 深圳无域科技技术有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 上海大邦律师事务所 31252 | 代理人: | 孙成 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 金融 逻辑 回归 特征 筛选 方法 系统 | ||
1.一种金融风控逻辑回归特征筛选方法,其特征在于,所述特征筛选方法包括:
步骤S1、获取可用于建模的所有特征,作为初始变量;
步骤S2、通过随机无放回取样的方式从步骤S1获取的初始变量中随机生成N份初始变量组合,形成N个初始数据模型;所述N个初始数据模型用于评估变量对于模型的贡献;
步骤S3、从设定数据集中拆分出1~n份数据,作为评估数据集;
步骤S4、上述构建的N个数据模型中,把每一个数据模型依次对各评估数据集进行评估,得到各评估数据集在各数据模型的评估数据;评估指标包括KS,AUC,如果关注模型分组风险单调性,则把模型分组风险单调性作为评估指标;
步骤S5、对于N个数据模型,每一个对应n份评估数据集评估结果;对于每一份评估数据集都选出排名前m的数据模型;
步骤S6、在n份评估数据集的排名前m的数据模型中,判断是否存在在每份数据集都出现的数据模型,若存在一个,将该数据模型作为最优数据模型f1;若存在至少两个,根据评估指标ESA和ESSD,选出初始变量组合中的最优数据模型f1;如果在每份数据集排名前m的模型中没有共同数据模型,则扩大选择范围,选择排名前m+o的数据模型,直到选出最优数据模型f1;其中,o为正整数;
步骤S7、以步骤S6选出的最优数据模型f1对应的变量组合为基础,逐个添加剩余变量进行建模,依据步骤S6逻辑选出泛化能力最佳模型f2;所述剩余变量指除了最优数据模型f1变量之外的所有变量;
步骤S8、根据模型在多份评估集上的综合评估指标,判断f2的评估结果在多数评估数据上是否提升,递归逐个添加剩余变量建模;直到评估结果在多数评估数据上较上一轮没有提升。
2.一种金融风控逻辑回归特征筛选方法,其特征在于,所述特征筛选方法包括:
步骤S1、获取可用于建模的所有特征,作为初始变量;
步骤S2、从步骤S1获取的初始变量中生成N份初始变量组合,形成N个数据模型;
步骤S3、从设定数据集中拆分出1~n份数据,作为评估数据集;
步骤S4、上述构建的N个数据模型中,把每一个数据模型依次对各评估数据集进行评估,得到各评估数据集在各数据模型的评估数据;
步骤S5、对于N个数据模型,每一个对应n份评估数据集评估结果;对于每一份评估数据集都选出排名前m的数据模型;
步骤S6、在n份评估数据集的排名前m的数据模型中,判断是否存在在每份数据集都出现的数据模型,若存在一个,将该数据模型作为最优数据模型f1;若存在至少两个,根据评估指标选出初始变量组合中的最优数据模型f1;如果在每份数据集排名前m的模型中没有共同数据模型,则扩大选择范围,选择排名前m+o的数据模型,直到选出最优数据模型f1;其中,o为正整数。
3.根据权利要求2所述的金融风控逻辑回归特征筛选方法,其特征在于:
所述方法进一步包括:
步骤S7、以步骤S6选出的最优数据模型对应的变量组合为基础,逐个添加剩余变量进行建模,依据步骤S6逻辑选出泛化能力最佳模型f2;所述剩余变量指除了模型f1变量之外的所有变量;
步骤S8、根据模型在多份评估集上的综合评估指标,判断f2的评估结果在多数评估数据上是否提升,递归逐个添加剩余变量建模;直到评估结果在多数评估数据上较上一轮没有提升。
4.根据权利要求2所述的金融风控逻辑回归特征筛选方法,其特征在于:
步骤S2中,通过随机无放回取样的方式从步骤S1获取的初始变量中随机生成N份初始变量组合。
5.根据权利要求2所述的金融风控逻辑回归特征筛选方法,其特征在于:
步骤S6中,若存在至少两个,根据估计排序平均值ESA和估计排序标准差ESSD,选出初始变量组合中的最优模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳无域科技技术有限公司,未经深圳无域科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010662195.1/1.html,转载请声明来源钻瓜专利网。