[发明专利]一种混合欺诈交易检测分类器建立方法及装置在审
申请号: | 201611111231.5 | 申请日: | 2016-12-02 |
公开(公告)号: | CN106651373A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 李旭瑞;邱雪涛;赵金涛;刘红宝;胡一非 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 欺诈 交易 检测 分类 建立 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种混合欺诈交易检测分类器建立方法及装置。
背景技术
随着互联网金融的发展,人们的支付习惯发生了较大的改变,随之而来的是日益猖獗的交易欺诈,这对现有的欺诈检测系统带来了前所未有的挑战。很多基于规则或是机器学习训练的模型被提出用于欺诈检测。
然而,现实交易中存在多种欺诈,例如伪卡欺诈、失窃卡欺诈、未达卡欺诈,而现如今的欺诈交易多为混合欺诈交易,即由多种类型的欺诈交易混合而成的欺诈交易,如果简单地将所有欺诈样本和正常样本进行合并后统一训练模型,所得到的结果往往不甚理想。因此,目前一般的做法是只针对具体某一种欺诈交易进行模型单独训练。这样在后续进行交易欺诈识别的时候,还需要制定一系列复杂的策略甚至人工地选择来进行多个模型结果的整合,这会严重的影响欺诈检测的速度和精度。此外,若要分类训练交易检测模型,还会遇到严重的数据不平衡性的问题。要想达到良好的混合欺诈检测的目的,必须解决数据不平衡的问题。传统的方法是通过删除部分正常交易样本或者简单地重复增加欺诈样本数据来达到欠采样或者过采样的目的来削弱数据的不平衡性。这样的做法缺乏物理意义的支撑,具有较大的随机性,因而效果提升并不显著。
综上所述,目前仍然缺少一种能够提高混合欺诈交易检测精度的模型训练方法。
发明内容
本发明提供一种混合欺诈交易检测分类器建立方法及装置,用以解决现有技术中存在的缺少一种提高混合欺诈交易检测精度的模型训练方法。
本发明实施例提供一种混合欺诈交易检测分类器建立方法,包括:
获取设定时长内的交易样本数据,交易样本数据包括正常交易样本和欺诈交易样本;
从欺诈交易样本中确定出典型欺诈交易样本集;
对正常交易样本进行聚类获取N个典型正常交易样本集;其中,N为正整数;
将典型欺诈交易样本集与每个典型正常交易样本集分别进行训练,得到N个分类器;
将N个分类器进行融合得到欺诈交易分类器。
可选地,从欺诈交易样本中确定出典型欺诈交易样本集,包括:
标定欺诈交易样本的欺诈交易类型;
根据欺诈交易样本中的欺诈交易种类数,根据各欺诈交易样本之间的欧式距离,采用K均值(K-means)聚类算法对欺诈交易样本进行聚类;
针对聚类后的样本,去除位于聚类边缘的欺诈交易样本,以及,去除聚类后所属类型与标定类型不一致的欺诈交易样本;
将剩余的欺诈交易样本确定为典型欺诈交易样本。
可选地,对正常交易样本进行聚类获取N个典型正常交易样本集,包括:
针对正常交易样本,根据各正常交易样本之间的欧式距离,采用Canopy聚类算法对正常交易样本进行粗聚类,获取N类粗聚类正常交易样本集,N大于等于1;
针对每一类粗聚类正常交易样本集,采用图形交并集规划获取该类粗聚类正常交易样本集的典型正常交易样本。
可选地,采用如下方式确定属于同类型的交易样本中的各交易样本之间的欧式距离,包括:
同类型的交易样本为同为欺诈交易样本或同为正常交易样本;
根据同类型的交易样本中的数值型特征属性和数值化后的非数值型特征属性构造交易样本矩阵;交易样本矩阵的行数表示同类型的交易样本的样本数量,列数表示同类型的交易样本中特征属性的数量;
分别计算同类型的交易样本的每一个特征属性的信息熵;信息熵根据公式(一)得到:
其中,Hj表示交易样本矩阵中第j特征属性的信息熵,n表示同类型的交易样本矩阵中的样本数,xij表示交易样本矩阵中第i个样本的第j个特征属性的特征属性数据;
根据每一个特征属性的信息熵,确定该特征属性的特征权值;特征权值代表了特征属性对分类器训练的贡献大小;特征权值由公式(二)得到:
其中,Wj为交易样本矩阵中第j特征属性的特征权值,Hj为交易样本矩阵中第j特征属性的信息熵;
分别根据同类型的交易样本的各特征属性的特征权值,采用公式(三)计算同类型的交易样本间的欧式距离:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611111231.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及系统
- 下一篇:移动安全结算网络的构建系统及使用方法