[发明专利]一种基于机器学习的P2P网贷客户信用评分方法及系统在审

专利信息
申请号: 201910508372.8 申请日: 2019-06-12
公开(公告)号: CN110264340A 公开(公告)日: 2019-09-20
发明(设计)人: 陈华龙;段浴;王善魏 申请(专利权)人: 重庆无界领智普惠商务信息咨询有限公司
主分类号: G06Q40/02 分类号: G06Q40/02;G06N20/00
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 赵荣之
地址: 401120 重庆市渝北*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 客户信息数据 基于机器 客户信息 客户信用 采集 机器学习算法 金融数据处理 资金周转困难 完整性验证 测试数据 评分模型 冗余数据 数据清洗 完整数据 稀疏数据 校验规则 测试集 训练集 截取 构建 学习 互联网 信用 客户 污染 应用 保证
【权利要求书】:

1.一种基于机器学习的P2P网贷客户信用评分方法,其特征在于:具体包括以下步骤:

S1:通过抓取借贷网站、金融网站数据指标采集有主动借贷意愿的主动借贷客户信息数据和有潜在借贷意愿的潜在借贷客户信息数据,综合整理成客户信息数据;

S2:对客户数据进行数据预处理,对采集到的一些冗余数据、稀疏数据、缺失不完整数据等受“污染”的数据进行数据清洗,检查数据一致性,处理无效值和缺失值;

S3:对初步清洗后的客户信息数据按校验规则进行有效性验证和完整性验证,验证合格的数据进行入库;

S4:截取部分客户信息数据进行数据划分,其中80%用于机器学习客户信用评分模型训练,20%用于机器学习客户信用评分模型测试;

S5:将客户信息数据输入到训练数据集中,通过机器学习算法构建机器学习客户信用评分模型;

S6:将客户信息测试数据集输入机器学习客户信用评分模型,输出得到客户信息综合评分,对客户信用评分进行验证,若合格则完成机器学习客户信用评分模型训练,若不合格则重新训练。

2.根据权利要求1所述的基于机器学习的P2P网贷客户信用评分方法,其特征在于:步骤S1中,所述采集的客户信息包含有主动借贷意愿的主动客户信息和有潜在借贷意愿的潜在客户信息;

所述主动客户信息包含客户基本信息、客户收入信息、客户资产信息、客户消费信息、客户历史行为信息以及其他客户补充信息;

所述潜在客户信息包含客户POS交易流水信息、客户网络购物消费信息、客户网络支付平台消费额度信息、客户社交信息。

3.根据权利要求1所述的基于机器学习的P2P网贷客户信用评分方法,其特征在于:步骤S2中,所述客户信息数据预处理包括数据分类、数据去重、数据填充、数据修正、数据转换和数据清洗;

所述数据转换是对不同平台及途径采集的数据,按统一要求的格式进行转换,以便后续数据处理;

所述数据清洗是对不符合要求的,不完整的、重复的、错误的“受污染”的客户信息数据,按照一定规则进行清洗;

所述数据分类是对客户信息数据进行特征分析,将整体混杂的数据按数据类别进行分类统计。

4.根据权利要求1所述的基于机器学习的P2P网贷客户信用评分方法,其特征在于:步骤S3中,所述有效性验证包括对客户信息数据进行日期格式校验及值阀校验;所述日期格式校验是检查数据日期字段是否满足规定的格式要求;所述值阀校验是检查数据字段取值是否在规定范围之内;

所述完整性验证包括对客户信息数据进行格式检查和空值检查;所述格式检查和空值检查,是检查数据字段是否为空,检查数据字段格式是否符合规范。

5.根据权利要求1所述的基于机器学习的P2P网贷客户信用评分方法,其特征在于:所述对客户信息机器学习信用评分模型进行训练,是通过客户信息先验数据对多层人工神经网络进行离线训练,训练结束后实行对新数据的辨识和推断。

6.根据权利要求1所述的基于机器学习的P2P网贷客户信用评分方法,其特征在于:步骤S5中,构建机器学习客户信用评分模型包括机器学习模型选取、交叉检验、变量的评估和筛选、参数优化及模型融合;

所述交叉检验是将数据集的索引进行拆分并按照一定的比例进行训练,得出返回模型,经过高学习率,将得出的模型取平均值;

所述变量的评估和筛选是通过筛选,得出模型中信用评分与其他客户数据间的相关性;

所述参数优化是采用交叉检验的方法自动得到最优参数;

所述模型融合是将数据训练集合划分为不同的个体学习器,单独构建模型,通过一定的结合策略将其集成一个强学习器。

7.一种基于机器学习的P2P网贷客户信用评分方法的系统,其特征在于:包括数据采集模块、数据预处理模块、机器学习模型训练模块和信用评分审核模块;

所述数据采集模块用于对有主动借贷意愿的主动客户和有潜在借贷意愿的潜在客户的信息数据采集;

所述数据预处理模块用于对采集的客户信息数据进行数据分类、数据去重、数据填充、数据修正、数据转换和数据清洗;

所述机器学习模型训练模块用于输入预处理好的客户信息数据,进行无监督的机器学习模型训练,输出得到训练完成的机器学习客户信用评分模型;

所述信用评分审核模块用于使用训练完成的机器学习客户信用评分模型,输入其他客户信息数据,输出客户信用评分,按放贷规则对客户信用评分进行评判,决定是否放贷。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆无界领智普惠商务信息咨询有限公司,未经重庆无界领智普惠商务信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910508372.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top