[发明专利]一种利用大数据进行信用评估的方法在审
申请号: | 201510763598.4 | 申请日: | 2015-11-11 |
公开(公告)号: | CN105354313A | 公开(公告)日: | 2016-02-24 |
发明(设计)人: | 王晟;黄汇;饶翔 | 申请(专利权)人: | 南京安讯科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京五月天专利商标代理有限公司 11294 | 代理人: | 李永联 |
地址: | 210012 江苏省南京市软件*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 数据 进行 信用 评估 方法 | ||
技术领域
本发明涉及一种利用大数据进行信用评估的方法。
背景技术
现有技术中,对用户的信用评估主要采取的方法有三种,第一种是让客户提供收入证明、房产证、银行流水等确定是否具备偿还能力;第二种是通过实地考察和直接面对面沟通,验证客户提供资料的真实性;第三种查询客户征信记录被查询的次数,上述三种方法存在的不足之处在于多由手工操作,效率低,且资料容易造假,信用评估效果差。
发明内容
本发明的发明目的在于提供一种利用大数据进行信用评估的方法,自动对原始数据进行筛选评估,效率高,且信用评估效果好。
实现本发明目的的技术方案:
一种利用大数据进行信用评估的方法,其特征在于:
步骤1:存储征信原始数据;
步骤2:按照征信对象对原始数据进行筛选,将原始数据划分成不同的维度,计算用于表达征信对象在对应维度的好坏分值;
步骤3:将步骤2获得的数据进行存储;
步骤4:利用已知样本对应各维度的计算结果进行机器学习,得到各维度的权重分配,进而计算获得各征信对象的最终分值,并进行数据存储。
步骤2中,原始征信数据具有三个维度,
第一维度是消费力维度,根据用户对应的通信消费账单、套餐、和终端类型数据得出用户的消费能力维度分值;
第二维度是行为爱好维度,根据用户的手机APP种类和PV时间分布数据得出行为爱好维度分值;
第三维度是位置维度,根据用户在某坐标点上的出现频率、驻留时间长度数据进行计算,得出位置维度分值。
步骤1中,采用Hadoop服务器集群的HDFS文件系统存储征信原始数据。
步骤2中,利用Hadoop集群的Yarn框架运行MapReduce,在Mapper中将原始数据按照征信对象进行初步筛选,在Reducer中汇总征信对象的各维度的数据,计算出用于表达征信对象在对应维度的好坏分值。
步骤3、步骤4中,存储数据采用可支持随机访问的HBase存储。
访问征信分值数据时,可利用MapReduce批量导出HBase中存储的征信分值数据,写入CSV格式的文件;或者实时访问HBase中的指定征信对象的征信分值数据。
步骤2中,原始征信数据划分还具有第四维度,第四维度是扩展数据维度。
本发明具有的有益效果:
本发明按照征信对象对原始数据进行筛选,将原始数据划分成不同的维度,计算用于表达征信对象在对应维度的好坏分值;利用已知样本对应各维度的计算结果进行机器学习,得到各维度的权重分配,进而计算获得各征信对象的最终分值。本发明可自动对原始数据进行筛选评估,效率高,且信用评估效果好。
本发明原始征信数据具有三个维度,第一维度是消费力维度,根据用户对应的通信消费账单、套餐、和终端类型数据得出用户的消费能力维度分值;第二维度是行为爱好维度,根据用户的手机APP种类和PV时间分布数据得出行为爱好维度分值;第三维度是位置维度,根据用户在某坐标点上的出现频率、驻留时间长度数据进行计算,得出位置维度分值。本发明基于上述三个维度对原始征信数据进行划分评分,使得信用评估效果更加客观。
本发明存储数据采用可支持随机访问的HBase存储。访问征信分值数据时,可利用MapReduce批量导出HBase中存储的征信分值数据,写入CSV格式的文件;或者实时访问HBase中的指定征信对象的征信分值数据,使得查询征信结果更加方便。
具体实施方式
本发明利用大数据进行信用评估的方法,包括如下步骤,
步骤1:存储征信原始数据;
实施时,采用Hadoop服务器集群的HDFS文件系统存储征信原始数据。多数据源条件下采用FTP,UDP,MQ,kafka多种技术手段予以实现。
步骤2:按照征信对象对原始数据进行筛选,将原始数据划分成不同的维度,计算用于表达征信对象在对应维度的好坏分值;
原始征信数据具有三个维度,
第一维度是消费力维度,根据用户对应的通信消费账单、套餐、和终端类型数据得出用户的消费能力维度分值;以通信消费账单为例,对于客户近12个月消费额波动曲线,计算出均值、正向波动率、负向波动率,以及近6个月和近3个月的正向、负向波动率,最终为这个维度打出一个分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京安讯科技有限责任公司,未经南京安讯科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510763598.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加强筋的生长式拓扑优化设计方法
- 下一篇:一种网络谣言的识别方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置