[发明专利]一种基于RF-DBSCAN算法的信用卡违约欺诈识别方法在审
申请号: | 202010851219.8 | 申请日: | 2020-08-21 |
公开(公告)号: | CN112001788A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 赵琳琳;袁野 | 申请(专利权)人: | 东北大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q30/00;G06K9/62;G06N20/00 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 韩国胜 |
地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rf dbscan 算法 信用卡 违约 欺诈 识别 方法 | ||
1.一种基于RF-DBSCAN算法的信用卡违约欺诈识别方法,其特征在于,其包括
以下步骤:
S1、将原始信用卡数据集进行离散化处理、归一化处理、特征属性筛选,经过对数据集的一系列规范化处理之后获得易于处理、少冗余、干净、非均衡的数据集;
S2、将S1得到的数据集进一步做代价敏感学习处理,对S1得到的非均衡数据集进行均衡化处理,使得违约用户的数量与可信任用户数量接近1:1;
S3、通过S1、S2得到的数据集进行特征属性的选取,对于数据集中所有的属性进行筛选,使用SPSS软件利用公式(3)进行属性之间冗余度计算检测;对其中高冗余的属性进行删除,确保在有限属性数量的基础上获得最大程度的信息量;
其中,rA,B表示属性AB之间的相关度,A表示属性A,B表示属性B,表示属性A,B的均值,σA表示属性A的标准差,σB表示属性B的标准差;
S4、将经过步骤S1、S2、S3处理之后的数据输入RF模型,构建RF模型首先采用Gini指标作为决策树的生成方式,之后确定RF模型最优随机分割变量数mtry和决策树的数量ntree,对训练集数据进行有效监督学习生成RF模型,对测试集样本作出分类得到可信任用户及违约用户分类结果;
S5、对S4学习生成的RF模型的分类精确度进行衡量,采用ROC曲线作为评价指标对RF模型分类性能进行测评,根据得到的高精确度分类结果来确保DBSCAN模型的输入数据高质量;
S6、将RF模型得到的分类结果赋予不同的初始欺诈概率值,借助DBSCAN算法能自发的形成任意形状的簇的特征,通过控制不同的聚类程度,来得到与之对应的不同的离异点;依据违约用户的初始欺诈阈值来设定欺诈概率的阈值,将大于阈值的数据作为DBSCAN模型的输入;
S7、DBSCAN模型的搭建,首先需要特征属性的重要度衡量,在RF模型中,依次删除单个特征属性其余属性保持不变,依据当前删除特征属性之后的性能下降的程度作为特征属性的重要度衡量指标,下降性能越多的,表明该特征属性对于分类任务越重要,选择最重要的两个属性作为DBSCAN模型的坐标值的依据,其次,借助DBSCAN模型的超参ε-邻域、邻域内样本个数M进行调控,来决定形成的簇的个数,从而控制聚类的聚集程度,以得到不同程度的离异点,根据离异的程度不同加以不同的欺诈概率,将得到的异常点加大其欺诈概率,对欺诈概率大的节点进行标明排序,最终,通过RF模型的分类结果及DBSCAN模型的欺诈概率与标的信息进行对比从而得到精确度衡量。
2.如权利要求1所述的信用卡违约欺诈识别方法,其特征在于,在步骤S1中,所述离散化处理用3-4-5规则处理,对应的根据3-4-5规则处理后的用户信用卡可用额度变量取值可以对应在如下五个层次,并为每个层次赋值,离散化处理采用公式(1);
其中,X1表示标的信息。
3.如权利要求1所述的信用卡违约欺诈识别方法,其特征在于,在步骤S1中,所述归一化处理采用最小—最大规范化处理所有的数据,采用公式如(2)所示;
4.如权利要求1所述的信用卡违约欺诈识别方法,其特征在于,在步骤S4中,所述决策树的生成包括:
S401、树的生长:对整个数据集的所有属性按照制定指标进行计算,按照GART树的生成方式来生成随机森林里的决策树,采用Gini指标作为衡量指标来找到能最大程度降低数据集的不确定性的属性,作为根节点开始生成整棵树,数据集按照该属性的所拥有的取值进行数据集的划分变成多个子集,再依次递归执行上述方法,循环地划分数据样本,直到每一个叶子节点所包含的数据集都是纯净的一个类别,决策树的生长过程结束;
S402、树的剪枝(tree pruning):决策树生成之后若存在过拟合的问题,剪枝过程则采用多数投票原则,决策树的不同分支给出的结果不一致,选取分类结果最多的作为最终结果,对于冗余的分支叶子节点处进行削减删除,进而提高整个树的要进行预测的测试集分性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010851219.8/1.html,转载请声明来源钻瓜专利网。