[发明专利]基于层次化聚类的欺诈检测方法及系统有效
申请号: | 201811522918.7 | 申请日: | 2018-12-12 |
公开(公告)号: | CN109886284B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 蒋昌俊;闫春钢;丁志军;刘关俊;张亚英;张友军 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 王华英 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 化聚类 欺诈 检测 方法 系统 | ||
一种基于层次化聚类的欺诈检测方法及系统,获取并分析交易特征信息得特征分析数据,根据特征分析数据选取聚类模型;获取样本数据集,根据聚类模型层次化聚类样本数据集以构造一树形结构,并划分样本数据集至树形结构的叶子节点中;分类叶子节点以获取节点类型数据;根据节点类型数据处理聚类树模型中的叶子节点,完成欺诈交易检测,解决了现有技术存在的性能考虑不全面、检测精确率低和类别不均衡的技术问题。
技术领域
本发明涉及一种金融欺诈检测系统,特别是涉及基于层次化聚类的欺诈检测方法及系统。
背景技术
随着电子商务的飞速发展,在线交易量的急剧增加,交易欺诈事件频发。由于互联网环境的开放性,欺诈者可以掌握诸如钓鱼网站、电话诈骗等多种欺诈手段;同时,由于付款方式的多样性、匿名性等特性,欺诈模式不断变化。面对这些问题,金融公司难以通过传统的基于规则的专家系统来检测欺诈性交易,这给公司和个人造成严重的经济损失。因此,研究如何建立一套有效的交易欺诈检测模型有着十分重要的现实意义。
为解决日益严峻的交易欺诈问题,很多机器学习模型被应用于欺诈交易检测中,其中包括支持向量机(SVM,Support Vector Machine)、K-最近邻(KNN,K-NearestNeighbor)、随机森林等分类模型。然而,由于交易数据集中的合法交易样本数要远多于欺诈交易样本数,即存在类别不均衡现象,这会很大程度上降低传统模型的分类性能,产生此问题主要有四个因素:不均衡比,样本规模,可分离性和类内子聚类。现有的改进方法主要是通过两个方面来减少类别不均衡现象对传统分类模型性能的负面影响,即数据层面和算法层面。数据层面,主要基于数据重采样的方法,以达到改变数据集中的正负样本比的目的,但这种方式会造成欠拟合或过拟合的风险;算法层面,主要通过修改已有分类模型结构,或者引入代价敏感函数等方式,以使得模型在训练过程中更加偏向于对少数类样本的学习,但这种方式却没有普适性,同时具有高复杂性。同时,从本质上看,它们只考虑了不均衡比这一个本质因素,而忽略了其他三个因素。
综上,现有技术存在性能考虑不全面、检测精确率低和类别不均衡的技术问题。
发明内容
鉴于以上现有技术的缺点,本发明的目的在于提供一种基于层次化聚类的欺诈检测方法及系统,解决了现有技术中存在的性能考虑不全面、检测精确率低和类别不均衡的技术问题。一种基于层次化聚类的欺诈检测方法,包括:获取并分析交易特征信息得特征分析数据,根据特征分析数据选取聚类模型;获取样本数据集,根据聚类模型层次化聚类样本数据集以构造一树形结构,并划分样本数据集至树形结构的叶子节点中;分类叶子节点以获取节点类型数据;根据节点类型数据处理聚类树模型中的叶子节点,完成欺诈交易检测。
于本发明的一实施方式中,获取并分析交易特征信息得特征分析数据,根据特征分析数据选取聚类模型包括:获取实际数据集,提取实际数据集中的交易特征信息;基于交易特征信息的可分离性分析得特征分析数据;将特征分析数据处理为分布判断数据;根据分布判断数据选取聚类模型。
于本发明的一实施方式中,获取样本数据集,根据聚类模型层次化聚类样本数据集以构造一树形结构,并划分样本数据集至树形结构的叶子节点中,包括:创建树形结构;获取样本数据集及叶子节点的节点条件数据并保存;根据节点条件数据选取当前叶子节点的适用处理逻辑;根据适用处理逻辑层次化类聚,将当前节点划分入树形结构;迭代前述步骤至样本数据集完全划分为树形结构中的叶子节点。
于本发明的一实施方式中,分类叶子节点以获取节点类型数据,包括:获取树形结构中的所有叶子节点;提取叶子节点的类别信息、均衡比数据及样本数信息;根据类别信息、均衡比数据及样本数信息对当前叶子节点进行分类;获取当前叶子节点的节点类型数据,循环执行前述步骤直至将所有叶子节点分类为单类别叶节点、类别均衡叶节点和含有异常样本叶节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811522918.7/2.html,转载请声明来源钻瓜专利网。