[发明专利]一种基于不平衡流数据分类的信用卡欺诈检测方法有效
申请号: | 202010107594.1 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111210343B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 任思琪;韩嵩 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 不平衡 数据 分类 信用卡 欺诈 检测 方法 | ||
1.一种基于不平衡流数据分类的信用卡欺诈检测方法,其特征在于:包括以下步骤:
1)在当前时刻输入信用卡流数据块,该流数据块中某一类别样本即信用卡使用的一类数据的数量少于另一类别的数量,即每个信用卡流数据块中样本的类别分布是不平衡的;
2)把该信用卡流数据块中的样本划分成两部分,即信用卡流数据训练块和信用卡流数据测试块,其中的信用卡流数据训练块作为训练集用于训练新的基础分类器,信用卡流数据测试块作为测试集用于评估检测方法的性能;
3)在当前的信用卡流数据训练块中,基于袋装算法获取若干类别分布平衡的子块,用于训练候选分类器;每个子块中包含了当前信用卡流数据训练块中的小样本以及一部分随机采样的大样本,并且随机采样大样本的数量取决于当前的信用卡流数据训练块中小样本的总量;
4)每个信用卡流数据子块训练得到一个基础分类器,每个基础分类器中的信用卡流数据训练块样本的类别分布是平衡的;
5)计算最新信用卡流数据训练块中样本的权重,其中易分错的信用卡流数据样本被赋予较高的更新权重;
6)使用最新的信用卡流数据块中样本更新分类模型中先前的基础分类器;
7)计算每个基础分类器的权重,去除分类模型中权重最小的基础分类器;同时去除性能较差的基础分类器,使得分类模型较快地适应新的信用卡流数据检测环境;
8)基于信用卡流数据基础分类器的权重,综合分类模型中所有基础分类器的性能,完成对信用卡流数据测试样本的欺诈检测。
2.根据权利要求1所述的一种基于不平衡流数据分类的信用卡欺诈检测方法:
步骤3)中训练候选分类器具体过程为:
1)评估当前信用卡训练数据块中数据集的不平衡率,即小样本的数量与大数量的比率;
2)若信用卡流数据小样本的数量不足以建立一定数量的候选分类器,则使用SMOTE算法生成一个新的小类集,该小类集中信用卡数据项的数量取决于信用卡流数据训练数据块中大样本的数量和小样本的数量;进而,使用新生成的小类集过采样候选信用卡流数据训练数据块中的小样本;
3)若信用卡流数据小样本的数量足够建立一定数量的候选分类器,则将大类集划分成若干子集,每个子集中信用卡流数据样本的数量等于候选训练数据块中小样本的数量;进而使用信用卡流数据训练块中所有的小样本以及每个划分得到的大类子集建立候选分类器。
3.根据权利要求1所述的一种基于不平衡流数据分类的信用卡欺诈检测方法:
步骤5)还包括使用分段函数机制评估基础分类器的权重,直接赋予信用卡流数据块候选分类器最高的权重。
4.根据权利要求1所述的基于不平衡流数据分类的信用卡欺诈检测方法,其特征在于:
步骤8)中若分类模型中基础分类器的数量超过设定的阈值,则使用一个基于性能的剪枝技术去除信用卡流数据分类模型中性能最差的信用卡流数据基础分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010107594.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种巩膜镜
- 下一篇:一种轴向盘式五自由度悬浮无轴承开关磁阻电机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置