[发明专利]个人信用得分优化评价方法在审
申请号: | 201710224341.0 | 申请日: | 2017-04-07 |
公开(公告)号: | CN107122890A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 徐达宇;魏致善;施宇伦 | 申请(专利权)人: | 信雅达系统工程股份有限公司;浙江农林大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/02;G06F17/18;G06K9/62 |
代理公司: | 杭州知通专利代理事务所(普通合伙)33221 | 代理人: | 姚宇吉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个人信用 得分 优化 评价 方法 | ||
技术领域
本发明涉及技术领域互联网金融信用技术领域,特别涉及一种个人信用得分优化评价方法。
背景技术
目前,国内外在个人信用得分评价上所采用的方法主要分为三大类:第一类是基于统计学模型的信用得分评价方法,如线性回归法、Logistic回归方法和Probit回归方法等回归模型以及基于K-近邻判别分析方法和贝叶斯概率模型的非参数信用得分评价方法;第二类是非统计学模型的信用得分评价方法,如神经网络、支持向量机、遗传算法和决策树等一系列人工智能算法;第三类是组合信用得分评价方法,该类模型利用多个信用得分评价模型,并根据各个算法的优缺点进行有机融合,可以获得比上述两类方法中的单个模型更好的计算效果,对于以上三类个人信用得分优化评价方法,都存在着各自的缺陷。
基于统计学模型的信用得分评价方法存在模型构建过程复杂,易于过度拟合,计算复杂度高等缺点,不适合当前面向大规模征信数据的个人信用得分评价应用;
基于非统计学模型的信用得分评价方法存在着评价结果易受噪声数据干扰而出现不稳定,以及评价过程不清晰而导致模型可解释性差等缺陷;
在组合评价方法中,由于Logistic回归模型存在不能够很好解决多重共线性的问题,甚至由于计算过多变量而导致模型复杂度的增加,从而降低了模型评价结果的准确性;同时,在信用得分评价过程中,Logistic回归模型无法根据实际情况动态调整“好”、“坏”客户错判所带来的损失-收益比。因此,在具体应用过程中也受到了一定的限制;最后,在面向当前基于大规模征信数据的个人信用得分评价应用中,Logistic回归模型因其计算复杂度高,在处理大数据时,其执行效率无法满足需求。
发明内容
为解决现有技术中个人信用得分评价过程中容易受噪声数据干扰;利用统计学中模型构建过程复杂;使用组合评价方法中计算过多导致模型更加复杂等技术问题,本发明提出一种计算复杂度低、容易建模的个人信用得分优化评价方法来实现。
一种个人信用得分优化评价方法,包括以下步骤:
根据历史个人信用数据,将征信覆盖范围内的客户进行信用标签标定;
根据信用标签标定结果,对信用指标进行筛选,获得评价使用的高质量征信数据;
根据筛选的结果对个人信用得分进行评价,具体计算步骤如下:构造决策树并对构造好的决策树进行剪枝,精简决策树模型,防止决策树在构造过程中过度拟合;采用Boosting推进,进一步提高决策树的准确性;构造成本矩阵与代价敏感树,能降低生成的决策树模型发生高成本误判的概率;对决策树进行修剪及交叉验证,进一步提高决策树的精确度;输入待评价数据,输出评价结果:利用构建完成的决策树模型,在决策树中输入待评价使用的征信数据,经过训练获得最终的个人信用评价结果。
作为一种可实施方式,所述对信用指标进行筛选的具体步骤如下:
设定个人信用得分评价指标构成的高维数据矩阵X={x1,x2,…,xn}和标签标定的信用得分因变量Y,在此,Y=1或者Y=0;
通过高维数据矩阵X={x1,x2,…,xn}和标签标定的信用得分因变量Y来构建回归模型,设定回归系数向量β=(β1,β2,…,βn),则回归模型表示为其中pi=P(yi=1|xi)表示给定xi的条件下yi=1的条件概率大小,xi为x1,x2,…,xn中的一值,i=1,2,...,n;1-pi=P(yi=1|xi)表示给定xi的条件下yi=0的条件概率大小,得到信用得分值的概率为N个信用得分值概率的似然函数为:
将公式(1)的似然函数进行对数化处理,处理后得到:
公式(2)中,α是回归模型中的回归参数,代表信用评价变量X={x1,x2,…,xn}以外的综合扰动变量,由式公式(2)可得在此pi表示某一特定评价值yi的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信雅达系统工程股份有限公司;浙江农林大学,未经信雅达系统工程股份有限公司;浙江农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710224341.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理