[发明专利]一种基于不平衡流数据分类的信用卡欺诈检测方法有效
申请号: | 202010107594.1 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111210343B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 任思琪;韩嵩 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 不平衡 数据 分类 信用卡 欺诈 检测 方法 | ||
本发明公开了一种基于不平衡流数据分类的信用卡欺诈检测方法。本发明信用卡流数据分类模型中包含了基于袋装的信用卡流数据过采样机制,信用卡流数据多类型概念漂移处理机制、信用卡流数据基础分类器加权机制、信用卡流数据集成剪枝机制以及分类预测机制。本发明无需保留任意过去时刻的信用卡流数据小样本,可以对类别分布不平衡的信用卡动态流数据进行有效地分类预测,以检测到信用卡欺诈交易数据。
技术领域
本发明涉及一种基于不平衡流数据分类的信用卡欺诈检测方法。
背景技术
信用卡的广泛使用,在为商家和用户交易带来极大方便的同时,也面临大量的信用卡欺诈,我国金融机构每年因信用卡欺诈损失数十亿元。信用卡欺诈是当前大数据金融时代国家与社会特别是银行业面临的一个金融风险,如何实现信用卡流数据欺诈检测是金融机构需要解决的一个重要技术问题和社会问题,具有重大的金融价值和社会意义。
在信用卡离线刷卡或在线购物应用背景下,产生了一种海量、实时、动态的数据形式,被称为信用卡流数据。信用卡流数据的动态变化称为概念漂移,是信用卡流数据最重要的特点之一,它描述着信用卡流数据分布随着环境而不断变化的过程。通常地,信用卡流数据分布的变化是不可事先预知的,这为信用卡动态流数据的分类提出了重大挑战。
传统的信用卡流数据分类技术假定数据分布是稳定的,然而在信用卡动态数据流场景中,信用卡流数据分布在不断变化。信用卡真实应用场景中的流数据往往包含了多种类型的概念漂移,然而,目前已存在的信用卡流数据分类方法通常只能处理某一特定类型的概念漂移,这并不能够满足信用卡欺诈检测的应用需求。
信用卡流数据分类过程中数据类别不平衡问题是信用卡欺诈检测的另一个重要问题。在信用卡流数据类别不平衡学习中,信用卡流数据块小样本的数量往往远远小于大样本的数量,因此传统的信用卡流数据分类技术,即仅考虑平衡数据流的分类技术对信用卡流数据小样本的识别能力很差。
传统分类器的训练通常是基于信用卡消费数据中类别分布是大致平衡这一假设,而该假设在信用卡流数据应用中并不成立。在信用卡不平衡流数据分类中,概念漂移和类别不平衡问题会共同降低信用卡流数据分类模型的性能,并且类别不平衡问题会加大概念漂移学习的难度。例如,信用卡流数据欺诈检测中基于分类性能的概念漂移检测机制会对不平衡率非常敏感,从而不能及时识别出数据分布的变化;类别不平衡处理技术需要随着信用卡流数据类别不平衡率的变化而适应性地调整。
在信用卡流数据欺诈检测分类研究中,现有的技术在概念漂移和类别不平衡处理机制方面虽然已分别取得了一定的成效,但处理二者联合问题的技术还比较缺乏。基于每次处理的信用卡流数据样本数量,处理概念漂移和类别不平衡联合问题的信用卡流数据欺诈检测技术可以分为在线算法和基于数据块的算法。在线算法每次只处理一个样本,因此算法的稳定性较差。基于数据块的算法每次都需要一定量的信用卡流数据样本去建立模型,因此这类算法的稳定性较好。然而,检测的性能往往对数据块的大小十分敏感,若信用卡流数据块过大,则用于训练基础分类器的训练集中很容易包含概念漂移。相反地,若信用卡流数据块过小,则基础分类器的信用卡流数据训练样本数量不足,很容易造成过拟合即信用卡流数据欺诈检测中造成欺诈数据被分为非欺诈样本。
为了处理信用卡流数据类别不平衡问题,块集成分类方法往往需要保留先前信用卡流数据块中的小样本,进而用以平衡信用卡流数据最新数据块中样本的类别分布。由于需要保留一部分先前时刻的信用卡流数据项,基于数据块的信用卡流数据欺诈检测分类方法不严格满足在线学习的需求。因此,若某时刻信用卡流数据样本的类别发生对调,则基于块的集成分类信用卡欺诈检测方法往往不能及时适应信用卡流数据新的数据流环境。
发明内容
为了弥补现有信用卡流数据欺诈检测方法的不足,本发明旨在提供一种基于不平衡流数据分类的信用卡欺诈检测方法,该方法可以快速、有效地提高对不平衡动态信用卡流数据的欺诈检测性能。
本发明解决技术问题所采取的技术方案为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010107594.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种巩膜镜
- 下一篇:一种轴向盘式五自由度悬浮无轴承开关磁阻电机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置