[发明专利]中小企业风险预警模型优化方法、装置、设备和存储介质在审
申请号: | 202110952875.1 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113506175A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 田野;陈珊珊;高殿卓 | 申请(专利权)人: | 北京中数智汇科技股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06;G06N20/00;G06K9/62 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 石岩 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中小企业 风险 预警 模型 优化 方法 装置 设备 存储 介质 | ||
本申请涉及一种中小企业风险预警模型优化方法、装置、设备和存储介质。其中,预先训练预警模型后,利用其对线上数据进行预测,并对预测结果标签进行监控;当确定满足预设的重训练条件时,在原有的训练数据的基础上引入新的训练数据并重新训练预警模型。如此,当模型准确率随着时间的推移而衰减,进而导致预测效果不佳时,可以引入新的数据重新训练预警模型,也即对预警模型进行优化,保证模型具有足够的预测准确率。
技术领域
本申请涉及企业风险预警技术领域,尤其涉及一种中小企业风险预警模型优化方法、装置、设备和存储介质。
背景技术
随着经济的发展,商业银行多元化、差异化的信贷产品越来越多,在方便广大企业获取更好的融资外,也对银行的风控手段产生了重大的冲击。因此,如何找到有效、及时的风险预警方法是商业银行迫在眉睫需要解决的痛点。
目前,可以通过机器学习建立模型,来预测企业在未来是否可能发生逾期风险,从而给银行提供预警,使得银行可以及时进行干预。不过,在模型的实际应用过程中,随着时间的推移,因为标签值(用于训练模型)口径发生变化而失准、部分风险企业因为提前干预后暂时消除风险等原因,会引起模型准确率衰减,导致预测效果不佳。
发明内容
本申请提供一种中小企业风险预警模型优化方法、装置、设备和存储介质,以解决模型准确率随着时间的推移而衰减,进而导致预测效果不佳的问题。
本申请的上述目的是通过以下技术方案实现的:
第一方面,本申请实施例提供一种中小企业风险预警模型优化方法,其包括:
利用预先训练的预警模型对线上数据进行预测;
对所述预警模型的预测标签进行监控;
当确定满足预设的重训练条件时,在原有的训练数据的基础上引入新的训练数据并重新训练预警模型。
可选的,所述预设的重训练条件包括:真实的逾期标签与模型预测的逾期标签的F1值小于预设值。
可选的,所述预设的重训练条件还包括以下项中的至少一项:
训练数据的维度变化大于设定值、统计口径的变更和新算法的引进。
可选的,预警模型的训练过程包括对训练数据进行特征工程,进行的特征工程具体包括:
删除含有未来数据的标签列;
删除缺失值超过预设百分比的标签列以及删除唯一值的标签列;
对枚举类型数据进行因子化编码;
对于有业务含义的变量衍生,按枚举变量对数值型变量进行统计,形成新的有业务含义的全局统计型变量;对于无业务含义的变量衍生,对数值型变量进行数学衍生、标准化和归一化衍生。
可选的,所述预警模型的训练过程包括:
利用机器学习算法对训练数据进行训练,初步得到预警模型;
采用未来的真实数据对初步得到的预警模型进行验证;验证指标为查全率和查准率;
基于验证结果,采用随机搜索算法在超参数空间内进行最优参数搜索;
采用预设选择算法对模型重要参数进行解析,并选取其中最重要的N维作为最终的入模变量;其中,N为超参数,N的取值范围为正整数;
基于选取的N维变量,利用机器学习算法进行重新训练,得到最终的预警模型。
可选的,在预警模型的训练过程中,增强表征逾期的训练数据的权重,并对不同时点的训练数据设置不同的权重;其中,训练数据的时点越接近当前时间则权重越高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中数智汇科技股份有限公司,未经北京中数智汇科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110952875.1/2.html,转载请声明来源钻瓜专利网。