[发明专利]一种智能组合的个人信用评估方法及系统在审
申请号: | 201810366753.2 | 申请日: | 2018-04-23 |
公开(公告)号: | CN108596757A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 李勇;陈军;叶正茂;吕耀中;张红月 | 申请(专利权)人: | 大连火眼征信管理有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116000 辽宁省大连市甘井子区*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练集 评分模型 测试集 样本数据获取 个人信用 样本数据 子模型 组数据 样本 数据处理模块 测试模块 测试效果 构建模块 模块获取 模型测试 评估模型 数据特征 特征产生 训练模块 训练模型 智能 评估 构建 测试 分组 信用 预测 | ||
本发明公开了一种智能组合的个人信用评估方法及系统,所述方法适用于所述系统,所述系统包括样本数据获取模块、样本数据处理模块、数据特征训练模块、评分模型构建模块和评分模型测试模块;所述方法包括步骤:S1由所述样本数据获取模块获取训练模型的样本数据;S2把样本分为训练集Ⅰ、训练集Ⅱ和测试集;S3对训练集Ⅰ、训练集Ⅱ和测试集的样本数据进行特征分组;S4对每组数据特征进行训练,并使每组数据特征产生一个对应的训练好的子模型;S5对训练好的子模型进行预测;及S6由所述评分模型测试模块将最终构建的信用评分模型放在测试集上进行测试,评估模型测试效果。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种信用评估的方法及系统。
背景技术
在中国经济高速发展的时期,个人收入增长较快,信用水平整体较高,但随着经济增速放缓后,个人信用风险中枢水平明显下行,并在一定区域呈现加速释放的现象,因此个人信用评分技术和产品的发展需要加快。对于中国目前的个人信贷业务来说,以纯信用贷款和由抵质押条款的贷款为主,均需要采集申请人的基本信息,如身份信息、收入信息、居住信息、支出信息、资产状况等多维度数据,现行的技术方案主要是由申请人自己准备资料,并到信贷机构网点处提交申请,有的民间借贷结构采用现场方式进行办理,但覆盖率有限,不成规模。此过程中,由申请人提供的资料需由网点人员进行真伪辨识,且由于是集中办理,申请人等待时间过长,一次完整的信用评估流程需要几个小时。互联网时代来临后,大数据征信成为可能。但是互联网企业往往只能获得客户的弱金融属性数据,而不能获得像征信数据这样的强金融属性数据,同时还有一部分互联网金融客户是征信白户:即无征信信息,传统的信用评分模型在没有强金融属性数据特征的情况下,模型的准确性较低,因此用传统的信用评分模型已不适用于新兴的互联网金融行业。
发明内容
本发明要解决的技术问题是提供了一种智能组合的个人信用评估方法及系统,首先用子模型提取数据特征,然后用权重模型将该特征进行拟合,这种模型组合的方式即满足了模型的可解释性要求,也达成了非线性模型具有的高效性和准确性。
本发明的技术方案是这样实现的:
一种智能组合的个人信用评估方法,该方法适用于一种个人信用评估系统,所述系统包括样本数据获取模块、样本数据处理模块、数据特征训练模块、评分模型构建模块和评分模型测试模块,所述智能组合的个人信用评估方法包括以下步骤:
S1由所述样本数据获取模块获取训练模型的样本数据,该样本数据包括至少一个数据特征;
S2由所述样本数据处理模块依照随机抽样,把样本分为训练集Ⅰ、训练集Ⅱ和测试集;
S3由所述样本数据处理模块根据数据来源或业务维度分别对训练集Ⅰ、训练集Ⅱ和测试集的样本数据进行特征分组;
S4由所述数据特征训练模块在训练集Ⅰ上用子模型对每组数据特征进行训练,并使每组数据特征产生一个对应的训练好的子模型;
S5由所述评分模型构建模块基于训练集Ⅱ的各组数据特征及其对应的训练集I训练好的子模型,得到训练集Ⅱ各组数据特征的拟合结果,然后使用Adaboosting和逻辑回归模型对训练集Ⅱ各组数据特征的拟合结果进行拟合、训练,并获取拟合模型中的权重信息,利用拟合出的权重信息构建信用评分模型;
S6由所述评分模型测试模块将最终构建的信用评分模型放在测试集上进行测试,评估模型测试效果。
较佳的,所述样本数据从客户关系管理系统、信贷系统、交易系统、社保数据爬虫系统、网购数据爬虫系统、运营商数据爬虫系统中提取;所述样本数据包括,但不限于客户人口信息、申请信息、社交信息、消费信息、社保公积金信息及征信信息。
较佳的,对训练集Ⅰ、训练集Ⅱ和测试集的样本数据进行特征分组后,每个集的数据按照相同标准划分为客户数据、申请数据、社交数据、消费数据和第三方数据,共5组数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连火眼征信管理有限公司,未经大连火眼征信管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810366753.2/2.html,转载请声明来源钻瓜专利网。