[发明专利]信用评分模型的构建方法、装置、设备及存储介质在审
申请号: | 201911331416.0 | 申请日: | 2019-12-21 |
公开(公告)号: | CN111080442A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 牛坤;刘彦;张在美;谢国琪 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N20/00 |
代理公司: | 长沙知行亦创知识产权代理事务所(普通合伙) 43240 | 代理人: | 严理佳 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用 评分 模型 构建 方法 装置 设备 存储 介质 | ||
本发明提供了一种信用评分模型的构建方法、装置、设备及存储介质,其中该构建方法包括:将原始不平衡信用数据集划分为训练集和验证集;所述原始不平衡信用数据集内的多个数据样本包括多个用户的信用信息,所述多个数据样本与所述多个用户一一对应;将所述训练集内的数据样本分为多数类训练样本和少数类训练样本;利用无监督聚类算法对所述多数类训练样本进行聚类,生成多个样本簇;根据所述多个样本簇和所述少数类训练样本,得到预设数量的平衡训练子集;根据得到的平衡训练子集、所述验证集以及预设决策树基分类器,构建信用评分模型。本发明能提升信用评分模型的分类性能。
技术领域
本发明涉及网络借贷技术领域,特别涉及一种信用评分模型的构建方法、装置、设备及存储介质。
背景技术
近年来,随着互联网及信息技术向金融领域渗透的程度日益加深,以互联网为载体的金融活动日渐丰富。互联网金融在全球范围内井喷式的发展,极大丰富了金融活动的内涵,给广大参与者带来了全新、便捷的体验。而与此同时,其配套体系的不完善,也使得这种野蛮生长背后的风险快速暴露并升级,尤其是以P2P网络贷款领域为甚。作为金融技术的一种形式,在过去十年里,P2P借贷市场由于其便捷性和较低的利率。在经济发达、网络安全的地区(美国、欧洲、中国)迅速扩张。贷款人根据风险偏好自由选择借款人和贷款金额,借款人只需在网上申请无抵押贷款即可。因此对借款人进行信用评估是至关重要的任务。而信用评分作为防范贷款风险的主要手段,过去几十年一直被广泛应用于银行等传统金融机构,但其在P2P网贷领域的应用尚少且不成熟。P2P作为一种个人与个人之间的小额信贷交易,与传统金融机构相比,其参与人员更加复杂,稂莠不齐,用于风险评估所需的个人信息也更加复杂,所以适用于传统金融机构的信用评分技术并不适用于新兴的P2P网络贷款。大数据和机器学习作为一种有效且流行的复杂数据处理技术被广泛应用于各个领域。因此如何利用这些前沿技术在P2P借贷中建立有效的信用评分模型是当前互联网金融行业迫切需要解决的问题。
信用评分本质上是一种二分类技术。其根据从贷款申请者的个人信息和历史借款记录中提取的记录将其分为信用良好的借款者和信用较差的借款者,进而决定是否接受申请者。在现实世界中,信用数据均存在一个固有的类不平衡问题,即绝大多数是信用良好的用户,只有极少部分是违约用户。而大部分标准分类器均认为两类样本是均匀分布,所以分类器在分类过程中受多数类主导,导致大量的少数类实例被错误的分类到多数类中。针对该问题,研究人员提出大量解决类不平衡的方法。其中重采样方法作为一种简单且有效的方法受到研究人员的广泛关注,并提出一些可以有效的提升分类器对少数类样本识别能力的重采样方法。这些方法通过对多数类进行欠采样来使数据平衡,但其在欠采样时未考虑多数类的数据分布,使多数类损失大量信息,进而使得多数类的分类准确率大幅下降。在类不平衡的数据中,假设两类的准确率下降相同幅度,那么被错误分类的多数类样本数量远大于少数类。也就是说,在以利润为导向的P2P借贷业务中,会导致大量的信用良好的借款者被拒绝,这同样会给平台和投资者带来利益损失。
发明内容
本发明提供了一种信用评分模型的构建方法、装置、设备及存储介质,其目的是为了解决信用评分模型的分类性能不高的问题。
为了达到上述目的,本发明的实施例提供了一种信用评分模型的构建方法,包括:
步骤1,将原始不平衡信用数据集划分为训练集和验证集;所述原始不平衡信用数据集内的多个数据样本包括多个用户的信用信息,所述多个数据样本与所述多个用户一一对应;
步骤2,将所述训练集内的数据样本分为多数类训练样本和少数类训练样本;
步骤3,利用无监督聚类算法对所述多数类训练样本进行聚类,生成多个样本簇;
步骤4,根据所述多个样本簇和所述少数类训练样本,得到预设数量的平衡训练子集;
步骤5,根据得到的平衡训练子集、所述验证集以及预设决策树基分类器,构建信用评分模型。
其中,所述步骤1包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911331416.0/2.html,转载请声明来源钻瓜专利网。