[发明专利]一种基于非平衡因子的资源归还风险预测方法及装置在审
申请号: | 202110179571.6 | 申请日: | 2021-02-07 |
公开(公告)号: | CN112529342A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 李达;丁楠;苏绥绥 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q40/02;G06N20/20 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 平衡 因子 资源 归还 风险 预测 方法 装置 | ||
本发明公开了一种基于非平衡因子的资源归还风险预测方法及装置,所述方法包括:基于非平衡因子构建加权非平衡损失函数的一阶导数和二阶导数;所述非平衡因子用于反映正负样本的权重;将所述一阶导数值和二阶导数值导入XGBoost模型中进行优化;将测试样本输入优化后的XGBoost模型中预测资源归还风险。本发明基于反映正负样本权重的非平衡因子构建加权非平衡损失函数的一阶导数和二阶导数;将所述一阶导数值和预测值的二阶导数值导入XGBoost模型中进行优化,通过非平衡因子来调整样本中正负样本比例差异对XGBoost模型预测精度的影响,从而解第一期非平衡分布的资源归还样本预测精度低的技术问题。
技术领域
本发明涉及计算机信息处理技术领域,具体而言,涉及一种基于非平衡因子的资源归还风险预测方法方法及装置。
背景技术
在基于互联网的应用技术中,常常需要在不同的参与方之间进行资源的交换。这里所称的资源是指任何可被利用的物质、信息、金钱、时间等。其中,信息资源包括计算资源和各种类型的数据资源。数据资源包括各个领域中的各种专用数据。与金钱相关的资源通常也称为金融资源,在金融资源交换期届满后,信贷用户需要归还金融资源。而在交换期限届满之前,信贷用户财务商务状况的重大不利变化很可能影响其履约能力,从而发生呆账、坏账等风险。因此,为了降低此类资源归还风险的发生概率,金融服务机构金融资源交换之前需要对信贷用户进行资源归还风险评估。
目前主要采用机器学习模型对资源归还风险进行评估,比如基于Logistic算法的评分卡模型,XGBoost模型等。然而,在实际中,资源归还一般分多期进行,正常用户一般在第一期都会按时履行资源归还的义务。因此,在第一期有资源归还风险的用户比例往往比较小,导致正负样本的分布不平衡,如果直接采用现有模型区预测第一期资源归还风险,会严重影响预测精度,给企业带来巨大经济损失。
发明内容
本发明旨在解决现有技术对于非平衡分布的资源归还样本预测精度低的技术问题。
为了解决上述技术问题,本发明第一方面提出一种基于非平衡因子的资源归还风险预测方法,所述方法包括:
基于非平衡因子构建加权非平衡损失函数的一阶导数和二阶导数;所述非平衡因子用于反映正负样本的权重;
将所述一阶导数值和二阶导数值导入XGBoost模型中进行优化;
将测试样本输入优化后的XGBoost模型中预测资源归还风险;
其中,所述将所述一阶导数值和二阶导数值导入XGBoost模型中进行优化包括:
将分布偏差值大于预设值的正负样本输入XGBoost模型中,并将XGBoost模型的输出结果映射到[0,1]区间,得到预测值;
将所述预测值及对应的标签值分别输入所述加权非平衡损失函数的一阶导数和二阶导数,得到预测值的一阶导数值和预测值的二阶导数值;
根据所述预测值的一阶导数值和预测值的二阶导数值确定XGBoost模型的最优参数。
根据本发明一种优选的实施方式,所述加权非平衡损失函数的一阶导数Ri1为:
;
所述加权非平衡损失函数的二阶导数Ri2为:
;
其中:If为非平衡因子,y(i)为第i个样本的标签值,yθ(i)为第i个样本的预测值,θ为XGBoost模型的参数。
根据本发明一种优选的实施方式,所述将分布偏差值大于预设值的正负样本输入XGBoost模型中,并将XGBoost模型的输出结果映射到[0,1]区间,得到预测值包括:
获取分布偏差值大于预设值的正负样本;
设置XGBoost模型的参数并建立树模型;
将所述正负样本输入所述树模型中得到模型输出值;
将所述模型输出值输入sigmoid函数中,得到预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110179571.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理