[发明专利]一种迭代特征筛选方法及系统在审
申请号: | 202110924607.9 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113610636A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 陈昶汝;王珍;杨丽娟 | 申请(专利权)人: | 百融云创科技股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06;G06K9/62;G06N20/00 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 刘铁生;孟阿妮 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 筛选 方法 系统 | ||
1.一种迭代特征筛选方法,其中,所述方法包括:
构建特征数据集;
基于降维法和逐步回归法构建迭代特征筛选模型;
将所述特征数据集输入所述迭代特征筛选模型,获得所述迭代特征筛选模型的输出结果,所述输出结果为筛选后的特征。
2.如权利要求1所述的方法,其中,所述构建特征数据集,包括:
获得预定基础指标;
对所述预定基础指标进行阈值调整,构建所述特征数据集。
3.如权利要求1所述的方法,其中,所述预定基础指标包括空值率、同值率、单变量IV、单变量KS、跨时间分布单变量PSI、相关性。
4.如权利要求1所述的方法,其中,所述降维法包括:主成分分析法、LASSO回归法中的一种。
5.如权利要求1所述的方法,其中,所述将所述特征数据集输入所述迭代特征筛选模型,获得所述迭代特征筛选模型的输出结果,所述输出结果为筛选后的特征,包括:
将所述特征数据集输入所述迭代特征筛选模型的降维层进行降维,获得第一输出结果;
将所述第一输出结果输入所述迭代特征筛选模型的特征筛选层,获得第二输出结果,所述第二输出结果为所述迭代特征筛选模型的输出结果。
6.如权利要求5所述的方法,其中,所述将所述第一输出结果输入所述迭代特征筛选模型的特征筛选层,获得第二输出结果,所述第二输出结果为所述迭代特征筛选模型的输出结果,包括:
获得预定特征筛选指标;
通过优化后的所述逐步回归法,基于所述预定特征筛选指标对所述第一输出结果进行特征筛选,获得所述第二输出结果。
7.如权利要求6所述的方法,其中,所述预定特征筛选指标包括AIC、BIC、KS、AUC、机器学习算法特征重要性。
8.一种迭代特征筛选系统,其中,所述系统包括:
第一构建单元,所述第一构建单元用于构建特征数据集;
第二构建单元,所述第二构建单元用于基于降维法和逐步回归法构建迭代特征筛选模型;
第一获得单元,所述第一获得单元用于将所述特征数据集输入所述迭代特征筛选模型,获得所述迭代特征筛选模型的输出结果,所述输出结果为筛选后的特征。
9.一种迭代特征筛选系统,包括至少一个处理器和存储器,所述至少一个处理器与所述存储器耦合,用于读取并执行所述存储器中的指令,以执行如权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百融云创科技股份有限公司,未经百融云创科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110924607.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种农田综合防治与修复装置
- 下一篇:基于大规模网络流的多路学习入侵检测方法