[发明专利]一种基于RF-DBSCAN算法的信用卡违约欺诈识别方法在审
申请号: | 202010851219.8 | 申请日: | 2020-08-21 |
公开(公告)号: | CN112001788A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 赵琳琳;袁野 | 申请(专利权)人: | 东北大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q30/00;G06K9/62;G06N20/00 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 韩国胜 |
地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rf dbscan 算法 信用卡 违约 欺诈 识别 方法 | ||
本发明涉及一种基于RF‑DBSCAN算法的信用卡违约欺诈识别方法,该方法首先,针对原始数据集进行离散化、归一化、均衡化处理;将处理之后的数据集作为RF模型的输入,通过调整寻找合适的参数组合,构建能够准确划分可信任客户与违约客户,得到可信任用户以及违约用户;赋予RF模型预测之后的可信任和违约用户不同的欺诈概率初值,给定欺诈阈值,对超过阈值的用户数据集作为DBSCAN模型的输入,通过控制聚类的不同程度来找到不同离异程度的点,并加重对应的样本可能欺诈的概率,从而使得决策者加深对高概率欺诈用户的审核门槛。本发明实现了在目前对信用领域的欺诈违约的预测,借助信用卡交易数据展开实证分析,表明在预测信用违约和识别欺诈方面的准确率高且预测效果好。
技术领域
本发明涉及一种基于RF-DBSCAN算法的信用卡违约欺诈识别方法,属于计算机应用技术领域。
背景技术
随着互联网的迅速发展,消费信贷热不断升温,人们也越来越倾向于先借款享受,后还款的消费观念。在金融信贷领域,不管是各大银行还是网络P2P借贷平台,都已经被发展成为一项具有应用前景,越来越多的企业借助现有成熟的机器学习模型对于信贷用户做出信用的评估等级,用以辅助是否放贷的决策。在信用卡领域故意使用伪造、作废的信用卡,冒用他人的信用卡骗取财物,或用本人信用卡进行恶意透支的行为层出不穷,无意给投资放贷带来了极大的风险。国内存在一些关于信用风险评估的文献研究表明了随机森林模型对于P2P网贷借款人风险评估的准确度相对较高。
在信贷交易过程中,双方信息并不对称。目前很多学者已经将反欺诈模型建立在神经网络、深度学习等算法去解决预测问题,但超参数无法确认是否最优,且容易出现过拟合的现象,训练过程冗长。
RF算法是集成学习的一种,在数据分析领域有广泛的应用场景。RF 模型对用户的特征进行提取,构建一棵棵决策树,以便减少分类方面误差,借助单个决策树和最多投票原则相结合,减少了模型的复杂度,同时RF可以处理二元特征、分类特征、数字特征,并且不需要进行任何缩放处理,对于输入的数据具有很好的容忍度。DBSCAN是一种常见的基于密度的聚类算法。聚类分析最关键就是要寻找数据集中由数据本身自发性的分组或者是数据挖掘者较为感兴趣的分组关系,它能够依据给定的阈值,自发的形成任意形状的簇,使得潜在的自然分组更容易被发现。其中的簇是密度相连的所有点的集合,在算法完成后可以自然的发现噪声点。这两个算法一个是有监督学习,能很好的进行分类,另一个是无监督学习,能很好的进行聚类帮助发现异常点。本发明通过有监督和无监督学习结合起来,进行分两步进行训练,完成信贷领域的违约和欺诈识别预测。
发明内容
(一)要解决的技术问题
为了解决现有信用违约欺诈和识别的技术问题,本发明提供一种基于RF-DBSCAN算法的信用卡违约欺诈识别方法。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种基于RF-DBSCAN算法的信用卡违约欺诈识别方法,其包括以下步骤:
S1、将原始信用卡数据集进行离散化处理、归一化处理、特征属性筛选,经过对数据集的一系列规范化处理之后获得易于处理、少冗余、干净、非均衡的数据集;
S2、由于S1得到的数据集中正负样本比例失衡,需对其进一步做代价敏感学习,对S1得到的非均衡的数据集进行均衡化处理,使得违约用户的数量与可信任用户数量接近1:1;
S3、通过S1、S2得到的数据集进行特征属性的选取,对于数据集中所有的属性进行筛选,各个变量之间可能存在着大量的冗余,使用SPSS 软件利用公式(3)进行属性之间冗余度计算检测,对高冗余的属性进行删除,确保在有限属性数量的基础上获得最大程度的信息量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010851219.8/2.html,转载请声明来源钻瓜专利网。