[发明专利]中小企业风险预警模型优化方法、装置、设备和存储介质在审
申请号: | 202110952875.1 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113506175A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 田野;陈珊珊;高殿卓 | 申请(专利权)人: | 北京中数智汇科技股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06;G06N20/00;G06K9/62 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 石岩 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中小企业 风险 预警 模型 优化 方法 装置 设备 存储 介质 | ||
1.一种中小企业风险预警模型优化方法,其特征在于,包括:
利用预先训练的预警模型对线上数据进行预测;
对所述预警模型的预测标签进行监控;
当确定满足预设的重训练条件时,在原有的训练数据的基础上引入新的训练数据并重新训练预警模型。
2.根据权利要求1所述的方法,其特征在于,所述预设的重训练条件包括:真实的逾期标签与模型预测的逾期标签的F1值小于预设值。
3.根据权利要求2所述的方法,其特征在于,所述预设的重训练条件还包括以下项中的至少一项:
训练数据的维度变化大于设定值、统计口径的变更和新算法的引进。
4.根据权利要求1所述的方法,其特征在于,预警模型的训练过程包括对训练数据进行特征工程,进行的特征工程具体包括:
删除含有未来数据的标签列;
删除缺失值超过预设百分比的标签列以及删除唯一值的标签列;
对枚举类型数据进行因子化编码;
对于有业务含义的变量衍生,按枚举变量对数值型变量进行统计,形成新的有业务含义的全局统计型变量;对于无业务含义的变量衍生,对数值型变量进行数学衍生、标准化和归一化衍生。
5.根据权利要求4所述的方法,其特征在于,所述预警模型的训练过程包括:
利用机器学习算法对训练数据进行训练,初步得到预警模型;
采用未来的真实数据对初步得到的预警模型进行验证;验证指标为查全率和查准率;
基于验证结果,采用随机搜索算法在超参数空间内进行最优参数搜索;
采用预设选择算法对模型重要参数进行解析,并选取其中最重要的N维作为最终的入模变量;其中,N为超参数,N的取值范围为正整数;
基于选取的N维变量,利用机器学习算法进行重新训练,得到最终的预警模型。
6.根据权利要求5所述的方法,其特征在于,在预警模型的训练过程中,增强表征逾期的训练数据的权重,并对不同时点的训练数据设置不同的权重;其中,训练数据的时点越接近当前时间则权重越高。
7.根据权利要求1所述的方法,其特征在于,预先训练预警模型以及重新训练预警模型时,采用相同的机器学习算法。
8.一种中小企业风险预警模型优化装置,其特征在于,包括:
预测模块,用于利用预先训练的预警模型对线上数据进行预测;
监控模块,用于对所述预警模型的预测标签进行监控;
重训练模块,用于当确定满足预设的重训练条件时,在原有的训练数据的基础上引入新的训练数据并重新训练预警模型。
9.一种智能设备,其特征在于,包括:
存储器和与所述存储器相连接的处理器;
所述存储器用于存储程序,所述程序至少用于实现如权利要求1-7任一项所述的中小企业风险预警模型优化方法;
所述处理器用于调用并执行所述存储器存储的所述程序。
10.一种存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器调用并执行时,实现如权利要求1-7任一项所述的中小企业风险预警模型优化方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中数智汇科技股份有限公司,未经北京中数智汇科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110952875.1/1.html,转载请声明来源钻瓜专利网。