[发明专利]一种基于粒子群优化LSSVM的违约用户概率预测方法在审
申请号: | 202011047313.4 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112308288A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 江远强;李兰;韩璐 | 申请(专利权)人: | 百维金科(上海)信息科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/00;G06K9/62;G06Q40/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201913 上海市崇明区长兴镇潘园公*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粒子 优化 lssvm 违约 用户 概率 预测 方法 | ||
本发明公开了一种基于粒子群优化LSSVM的违约用户概率预测方法;S1:获取样本数据;S2:对采集的数据特征提取;S3:建立LSSVM分类模型;S4:采用粒子群算法对S3中训练得到的LSSVM预测模型参数组合(C,σ)进行优化;S5:将测试数据集输入到训练好的LSSVM的违约用户概率预测模型;S6:将LSSVM预测模型部署至申请平台;本发明基于粒子群优化的LSSVM算法的违约概率预测模型,预测精度良好,误差评价指标均维持在较小的范围内,降低预测风险的目的,极大提高了算法的收敛速度,满足互联网金融申请行为在线预测模型要求。
技术领域
本发明属于概率预测技术领域,具体涉及一种基于粒子群优化LSSVM的违约用户概率预测方法。
背景技术
在当前互联网金融行业,对于客户的违约概率的预测方法主要有:逻辑回归、随机森林、GBDT和神经网络等机器学习算法,然而这些算法存在一些不足之处:神经网络模型具有良好的非线性逼近能力,但它需要指定模型中与网络拓扑有关的各种参数,需要大样本数据量进行训练且极易陷入局部最优问题。而支持向量机(Support Vector Machine,SVM)基于现代统计学理论,融合结构风险最小化原则和核技术的一种算法,具有非线性、高维度、预测精度高、泛化能力强和易于寻求全局最优解等特点,但SVM需要借助二次规划获得支持向量,且约束条件为不等式约束,当训练样本数量增大时,二次规划问题将面临“维数灾难”。对于大规模的互联网金融的行为数据来说,SVM存在训练速度慢,耗时长等问题,难以满足互金平台在线预测申请用户违约概率的要求。
最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)是SVM的拓展与改进,它引入了最小二乘的思想,用二次损失函数取代SVM中的不敏感损失函数,采用二次规划方法将SVM中的不等式约束改为等式约束,使标准SVM求解二次规划问题转化为求解一组线性关系式,优化函数只需解线性等式方程组,LSSVM在继承SVM优点的同时,运算过程得到简化,提高了算法的收敛速度,提升了训练效率与准确性,能够很好地解决数据量大、过学习以及高维数等实际问题,能够实现对互金平台在线预测申请用户违约概率的要求。
LSSVM性能的好坏在很大程度上取决于所选的核函数参数,RBF核函数有着极高的性能,基于RBF核函数的LSSVM的参数主要涉及到正则化参数C和核宽度σ,直接影响LSSVM的拟合性能和泛化能力,严重制约着此方法的预测精度和性能,因此对其参数选择很重要。传统基于经验选择参数的方法随机性强,基于网格搜索、交叉验证等优化方法存在计算量大、耗时长、预测精度低等问题,遗传算法及人工神经网络算法等方法优化LSSVM参数也存在容易陷入局部最优、收敛速度慢、耗时长等缺点,现有技术面临着各种各样的问题。
如授权公告号为CN109919436A所公开的一种基于稀疏特征嵌入的违约用户概率预测方法,其虽然实现了有效提高了类别编码的处理能力,同时在后续机器学习的流程中有效降低了特征空间的维度,有利于机器学习模型的学习和处理,但是并未解决现有概率检测中存在的算法步骤过多的问题,不可避免造成了系统冗余,无法实现非线性、不可微和多峰值的复杂问题的求解的问题,为此我们提出一种基于粒子群优化LSSVM的违约用户概率预测方法。
发明内容
本发明的目的在于提供一种基于粒子群优化LSSVM的违约用户概率预测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于粒子群优化LSSVM的违约用户概率预测方法,包括有以下步骤:
S1:获取样本数据,从互联网金融平台后端根据贷后表现选取相同数量的正常还款和逾期客户作为建模样本,获取样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据;
S2:对采集的数据特征提取,进行标准化处理和主成分分析降维,按申请时间划分训练集和验证集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百维金科(上海)信息科技有限公司,未经百维金科(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011047313.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种hud功能测试系统
- 下一篇:媒体传输质量指标检测方法、装置及存储介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理