[发明专利]基于大数据的信用评估方法、装置、电子设备及存储介质在审
申请号: | 201810960866.5 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109345368A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 林荣吉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用评估 指标变量 大数据 变量特征 存储介质 电子设备 分箱 初始聚类中心 多个变量 分布特征 聚类运算 模型评估 样本用户 评估 信用 | ||
本发明的实施例提供了一种基于大数据的信用评估方法、装置、电子设备及存储介质,涉及大数据技术领域。该方法包括:采用等频法对样本用户的多个指标变量进行划分,获得多个等频区间;将所述等频区间的端点作为初始聚类中心对所述多个指标变量进行聚类运算,得到各个指标变量的多个变量分箱;从各个指标变量的所述变量分箱中提取变量特征,基于所述变量特征对信用评估模型进行训练;通过训练后的所述信用评估模型对待评估用户的信用进行评估。本发明实施例的技术方案能够更准确地反映不同指标变量的变量值分布特征,从而能够提高信用评估模型评估的准确性。
技术领域
本发明涉及大数据技术领域,具体而言,涉及一种信用评估方法、信用评估装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网金融的发展,越来越多的人通过网络平台购买金融产品,金融机构为了降低经营风险,需要对用户的信用进行评估。
现有的信用评分模型中,需要对样本数据中的变量进行分箱即离散化处理,主要的分箱方法包括等距分箱和等频分箱,等距分箱是指划分后每个分箱的区间值相等,等频分箱是指划分后每个分箱的数据量相等,然而这两种分箱方法都难以反映不同变量的变量值分布特征,使得信息评估模型的评估结果的准确率较低。
因此,需要提供一种能够解决上述问题中的一个或多个问题的信用评估方法、信用评估装置、电子设备以及计算机可读存储介质。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种信用评估方法、信用评估装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明实施例的第一方面,提供了一种信用评估方法,包括:采用等频法对样本用户的多个指标变量进行划分,获得多个等频区间;将所述等频区间的端点作为初始聚类中心对所述多个指标变量进行聚类运算,得到各个指标变量的多个变量分箱;从各个指标变量的所述变量分箱中提取变量特征,基于所述变量特征对信用评估模型进行训练;通过训练后的所述信用评估模型对待评估用户的信用进行评估。
在本发明的一些实施例中,基于前述方案,从各个指标变量的所述变量分箱中提取变量特征,包括:对各个指标变量的所述多个变量分箱进行WOE编码;将所述多个变量分箱的WOE编码作为各个指标变量的变量特征。
在本发明的一些实施例中,基于前述方案,对各个指标变量的所述多个变量分箱进行WOE编码,包括:通过下式对各个指标变量的所述多个变量分箱进行WOE编码,
其中,Gi为第i个变量分箱下的正常用户数量,Gtotal为指标变量下的正常用户的总数量,Bi为第i个变量分箱下的不良用户数量,Btotal为指标变量下的不良用户的总数量。
在本发明的一些实施例中,基于前述方案,所述信用评估方法还包括:对各个变量分箱的所述WOE编码进行加权运算得到各个指标变量的信息值;基于各个指标变量的所述信息值对所述多个指标变量进行筛选。
在本发明的一些实施例中,基于前述方案,采用等频法对样本用户的多个指标变量进行划分,包括:获取所述样本用户的历史数据中的所述多个指标变量;确定所述多个指标变量中的连续变量,并对所述连续变量赋予宏;采用等频法对赋予宏的所述连续变量进行快速分箱。
在本发明的一些实施例中,基于前述方案,所述信用评估方法还包括:基于宏代码编写各个指标变量的变量分箱以及各个指标变量的变量分箱的WOE编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810960866.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实时多任务处理的会计记账系统
- 下一篇:备付金的配置方法及终端设备