[发明专利]一种基于归类规则分类器的信用评级方法在审
申请号: | 201810414526.2 | 申请日: | 2018-05-03 |
公开(公告)号: | CN108596758A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 杨胜刚;陈佐;彭涵祺;赵寒枫;陈邦道;梅雪松;余湘军;李浩之;王芍 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 邹大坚;胡君 |
地址: | 410082 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征属性 信用评级 分类器 评级 用户信用信息 归类规则 评级模型 模型训练 信息对应 信用信息 训练集 输出 分类 评估 | ||
1.一种基于归类规则分类器的信用评级方法,其特征在于,步骤包括:
S1.RIPPER评级模型训练:获取用于模型训练的用户信用信息集,分别提取所述用户信用信息集中各信息对应的特征属性构成训练集,并使用RIPPER分类器进行训练,得到RIPPER评级模型;
S2.信用评级:输入待评估用户的信用信息并提取对应的特征属性,将提取到的特征属性输入至所述RIPPER评级模型中进行分类,得到信用评级结果输出。
2.根据权利要求1所述的基于归类规则分类器的信用评级方法,其特征在于,所述步骤S1中的具体步骤为:
S11.提取所述用户信用信息集中各原始信用信息对应的特征属性,得到属性数据集,对所述属性数据集进数据预处理后输出;
S12.将所述步骤S11输出的属性数据集进行属性筛选,将筛选后不同的离散属性进行统一后输出;
S13.将所述步骤S12输出的属性数据集进行分类评级后构成训练集;
S14.将所述步骤S13得到的训练集使用RIPPER分类器进行训练,得到RIPPER评级模型。
3.根据权利要求2所述的基于归类规则分类器的信用评级方法,其特征在于:所述步骤S11进行数据预处理时,具体包括将所述属性数据集中缺失值进行填充处理,所述属性数据集中冗余值、异常值进行删除处理;所述缺失值进行填充处理时,具体对集中型缺失值使用中位数、众数或拉格朗日插值中的一种填充方式,对离散型缺失值使用上下文填充方式。
4.根据权利要求3所述的基于归类规则分类器的信用评级方法,其特征在于,所述步骤S14中具体将所述训练集随机打乱分配后进行训练。
5.根据权利要求1~4中任意一项所述的基于归类规则分类器的信用评级方法,其特征在于,所述步骤S1中使用RIPPER分类器进行训练时,具体将包含用户信用特征属性的训练集中不属于规则的数据项随机的分为增长集和缩减集两个子集,对所述增长集执行规则的扩张过程时,初始把规则的条件置空,再反复的加入如下公式条件,以使得信息增益Gain(D,At)达到更大的值,并提高规则对数据项的覆盖面,直到规则涵盖了增长数据集中的所有数据项;
Ad=v,An≤θ或An≥θ
其中,Ad是字符型的属性,v是Ad的一个有效值;An是实数型的变量,θ是在训练集中出现的An的有效值;
对所述缩减集执行规则缩减过程时,依次从规则的条件中剔除最后一个条件,使函数值v达到最大,函数v的表达式为:
其中,Rule为训练规则;PrunePos为正例修剪集;PruneNeg为负例修剪集,p裁剪集中被规则覆盖的肯定的样本数;n裁剪集中被规则覆盖的否定的样本数;
重复执行上述过程直到通过缩减条件和删除规则无法使v的值增大为止,生成最终的RIPPER评级模型及分类规则。
6.根据权利要求1~4中任意一项所述的基于归类规则分类器的信用评级方法,其特征在于:所述步骤S1中进行训练时具体使用十折交叉验证方式以避免模型过拟合,即将训练集分为10份,将其中9份作为训练数据、其余一份作为测试数据,经过多次迭代后,选取在不同测试集上分类精度均达到指定阈值所对应的模型作为所需的所述RIPPER评级模型。
7.根据权利要求1~4中任意一项所述的基于归类规则分类器的信用评级方法,其特征在于:所述步骤S1中还包括使用ROC曲线对得到的所述RIPPER评级模型进行评估,若所述RIPPER评级模型对应计算到的ROC曲线下的面积在预设范围内,输出最终的RIPPER评级模型,否则重新进行训练。
8.根据权利要求1~4中任意一项所述的基于归类规则分类器的信用评级方法,其特征在于:所述用户信用信息包括用户基础信息、用户借款信息、用户负债信息、用户历史指定时间段内还款逾期信息、用户未来指定之间段内需还款信息、用户投标信息以及用户负债信息中一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810414526.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能组合的个人信用评估方法及系统
- 下一篇:贷款申请信息检测方法及服务器