[发明专利]一种基于不平衡流数据分类的信用卡欺诈检测方法有效

专利信息
申请号: 202010107594.1 申请日: 2020-02-21
公开(公告)号: CN111210343B 公开(公告)日: 2022-03-29
发明(设计)人: 任思琪;韩嵩 申请(专利权)人: 浙江工商大学
主分类号: G06Q40/02 分类号: G06Q40/02;G06K9/62
代理公司: 杭州奥创知识产权代理有限公司 33272 代理人: 王佳健
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 不平衡 数据 分类 信用卡 欺诈 检测 方法
【权利要求书】:

1.一种基于不平衡流数据分类的信用卡欺诈检测方法,其特征在于:包括以下步骤:

1)在当前时刻输入信用卡流数据块,该流数据块中某一类别样本即信用卡使用的一类数据的数量少于另一类别的数量,即每个信用卡流数据块中样本的类别分布是不平衡的;

2)把该信用卡流数据块中的样本划分成两部分,即信用卡流数据训练块和信用卡流数据测试块,其中的信用卡流数据训练块作为训练集用于训练新的基础分类器,信用卡流数据测试块作为测试集用于评估检测方法的性能;

3)在当前的信用卡流数据训练块中,基于袋装算法获取若干类别分布平衡的子块,用于训练候选分类器;每个子块中包含了当前信用卡流数据训练块中的小样本以及一部分随机采样的大样本,并且随机采样大样本的数量取决于当前的信用卡流数据训练块中小样本的总量;

4)每个信用卡流数据子块训练得到一个基础分类器,每个基础分类器中的信用卡流数据训练块样本的类别分布是平衡的;

5)计算最新信用卡流数据训练块中样本的权重,其中易分错的信用卡流数据样本被赋予较高的更新权重;

6)使用最新的信用卡流数据块中样本更新分类模型中先前的基础分类器;

7)计算每个基础分类器的权重,去除分类模型中权重最小的基础分类器;同时去除性能较差的基础分类器,使得分类模型较快地适应新的信用卡流数据检测环境;

8)基于信用卡流数据基础分类器的权重,综合分类模型中所有基础分类器的性能,完成对信用卡流数据测试样本的欺诈检测。

2.根据权利要求1所述的一种基于不平衡流数据分类的信用卡欺诈检测方法:

步骤3)中训练候选分类器具体过程为:

1)评估当前信用卡训练数据块中数据集的不平衡率,即小样本的数量与大数量的比率;

2)若信用卡流数据小样本的数量不足以建立一定数量的候选分类器,则使用SMOTE算法生成一个新的小类集,该小类集中信用卡数据项的数量取决于信用卡流数据训练数据块中大样本的数量和小样本的数量;进而,使用新生成的小类集过采样候选信用卡流数据训练数据块中的小样本;

3)若信用卡流数据小样本的数量足够建立一定数量的候选分类器,则将大类集划分成若干子集,每个子集中信用卡流数据样本的数量等于候选训练数据块中小样本的数量;进而使用信用卡流数据训练块中所有的小样本以及每个划分得到的大类子集建立候选分类器。

3.根据权利要求1所述的一种基于不平衡流数据分类的信用卡欺诈检测方法:

步骤5)还包括使用分段函数机制评估基础分类器的权重,直接赋予信用卡流数据块候选分类器最高的权重。

4.根据权利要求1所述的基于不平衡流数据分类的信用卡欺诈检测方法,其特征在于:

步骤8)中若分类模型中基础分类器的数量超过设定的阈值,则使用一个基于性能的剪枝技术去除信用卡流数据分类模型中性能最差的信用卡流数据基础分类器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010107594.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top