[发明专利]迁移率预测模型的训练方法、使用方法、装置及设备在审
申请号: | 202111029216.7 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113935495A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 李骏琪;邵俊;万友平 | 申请(专利权)人: | 深圳索信达数据技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q40/02 |
代理公司: | 深圳中细软知识产权代理有限公司 44528 | 代理人: | 孔祥丹 |
地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 迁移率 预测 模型 训练 方法 使用方法 装置 设备 | ||
本发明实施例公开一种迁移率预测模型的训练方法,通过在服务器端利用非隐私数据和类别标签进行第一迁移率预测模型的训练,使得最终得到的模型对待预测用户进行预测时能够识别当前用户类别,增强模型的学习能力且提高预测准确度性;并且在客户端处利用隐私数据对第一迁移率预测模型进行训练得到第二迁移率预测模型,可以增强用于实时预测的模型的稳定性和泛化性能,能够提高第二迁移率预测模型对各个用户进行预测的自适应性、实效性和准确性,增强了通过机器学习对用户的迁移率预测的准确性;且第二迁移率预测模型在客户端上能够使用单独用户的较少数据进行快速迭代,既降低了模型的数据成本,又可保证对各个用户的个性化预测,提高预测准确性。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种迁移率预测模型的训练方法、使用方法、装置及设备。
背景技术
在现有技术中,利用light-gbm等机器学习方法对用户迁移率进行预测建模以进行逾期风险的预警,实现提前进入逾期还款的干预状态,降低坏账损失,但是,现有技术中需要较大的数据量进行建模与后续迭代,且不能排除数据分布变化的干扰,稳定性较弱。同时,现有技术中对样本特征要求较高,在不便于采集用户隐私数据特征的金融场景中训练效果和预测效果都会受到影响,预测准确性有待提高。
发明内容
本发明的主要目的在于提供一种迁移率预测模型的训练方法、装置、计算机设备及存储介质,可以解决现有技术中对用户迁移率进行预测准确性不高的问题。
为实现上述目的,本发明第一方面提供一种迁移率预测模型的训练方法,所述方法应用于服务器,所述方法包括:
获取目标用户的第一样本数据集,所述第一样本数据集包括所述目标用户的非隐私数据以及所述目标用户的类别标签;
将所述第一样本数据集包括的训练集输入梯度提升模型进行单步预测,确定第一损失;根据所述第一损失及梯度算法,得到一阶梯度;
将所述第一样本数据集包括的测试集输入所述梯度提升模型进行单步预测,得到第二损失;根据所述第二损失、所述一阶梯度以及学习率,确定二阶梯度;
利用所述二阶梯度对所述梯度提升模型进行单步更新,得到更新后的梯度提升模型;返回执行所述获取目标用户的第一样本数据集的步骤,直至返回执行次数达到预设迭代次数,并将最后得到的梯度提升模型确定为第一迁移率预测模型;
将所述第一迁移率预测模型分发至各个待预测用户对应的客户端。
在一种可行实现方式中,所述将最后得到的梯度提升模型确定为第一迁移率预测模型之后,还包括:
利用所述第一迁移率预测模型对各个候选用户进行迁移率预测,得到各个所述候选用户对应的迁移率;
利用各个所述候选用户对应的迁移率及预设统计学算法,确定统计均值和统计方差;
将所述统计均值和统计方差分发至各个所述待预测用户对应的客户端,所述客户端用于基于所述统计均值和统计方差确定风险信号强度,所述风险信号强度用于指示所述待预测用户的逾期还款的风险强度。
在一种可行实现方式中,将所述第一迁移率预测模型分发至各个待预测用户对应的客户端,之后还包括:
接收各个所述待预测用户对应的客户端上报的风险提示信息,所述风险提示信息包括风险信号强度;
根据所述风险信号强度及预设的等级确定规则,确定所述风险信号强度对应的风控等级;
基于所述风控等级对所述待预测用户执行对应的风控操作。
在一种可行实现方式中,所述获取目标用户的第一样本数据集之前还包括:
获取样本用户的非隐私数据,根据所述非隐私数据对已达到风险表现期的候选用户进行聚类,得到所述候选用户对应的类别标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳索信达数据技术有限公司,未经深圳索信达数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111029216.7/2.html,转载请声明来源钻瓜专利网。