[发明专利]基于层次化聚类的欺诈检测方法及系统有效
申请号: | 201811522918.7 | 申请日: | 2018-12-12 |
公开(公告)号: | CN109886284B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 蒋昌俊;闫春钢;丁志军;刘关俊;张亚英;张友军 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 王华英 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 化聚类 欺诈 检测 方法 系统 | ||
1.一种基于层次化聚类的欺诈检测方法,其特征在于,包括:
获取并分析交易特征信息得特征分析数据,根据所述特征分析数据选取聚类模型;
获取样本数据集,根据所述聚类模型层次化聚类所述样本数据集以构造一树形结构,并划分所述样本数据集至所述树形结构的叶子节点中;
分类所述叶子节点以获取节点类型数据;
根据所述节点类型数据处理聚类树模型中的所述叶子节点,完成欺诈交易检测;
其中,所述获取样本数据集,根据所述聚类模型层次化聚类所述样本数据集以构造一树形结构,并划分所述样本数据集至所述树形结构的叶子节点中,包括:
创建所述树形结构;
获取所述样本数据集及叶子节点的节点条件数据并保存,所述节点条件数据包括数据集Dataset、叶节点的均衡比BRate、叶节点最少样本数Msize及通过所述数据集Dataset、所述叶节点的均衡比BRate、所述叶节点最少样本数Msize计算数据集Dataset的正负样本数,所述数据集Dataset的正负样本数分别保存在N1和N0中;
根据所述节点条件数据选取当前所述叶子节点的适用处理逻辑,所述适用处理逻辑包括,
判断当前所述数据集Dataset是否符合所述叶节点的三个条件,所述三个条件如下:
若所述数据集Dataset的N1或者N0的值为0,则满足单类别叶节点条件,需使用直接返回当前所述叶节点中数据子集的类别来处理当前所述叶节点,
若所述数据集Dataset的N1与N0的比值小于所述叶节点的均衡比Brate,则满足类别均衡叶节点条件,需使用支持向量机分离器对当前所述叶节点中的所述数据子集进行分类,
若所述数据集Dataset的N1与N0的总数小于所述叶节点最少样本数Msize,则满足含有异常样本叶节点条件,需使用K近邻模型对当前所述叶节点中的所述数据子集进行异常检测,
若所述数据集Dataset均未满足,则当前所述节点为非叶子节点,需使用K-Means聚类模型或者高斯混合模型对当前所述节点中的数据集进行聚类,并对划分到每个簇中的数据子集递归调用当前过程,其结果将作为当前所述节点的子树;
根据所述适用处理逻辑层次化聚类,将当前节点划分入所述树形结构;
迭代至所述样本数据集完全划分为所述树形结构中的所述叶子节点。
2.根据权利要求1所述的方法,其特征在于,所述获取并分析交易特征信息得特征分析数据,根据所述特征分析数据选取聚类模型包括:
获取实际数据集,提取所述实际数据集中的交易特征信息;
基于所述交易特征信息的可分离性分析得所述特征分析数据;
将所述特征分析数据处理为分布判断数据;
根据所述分布判断数据选取所述聚类模型。
3.根据权利要求1所述的方法,其特征在于,所述分类所述叶子节点以获取节点类型数据,包括:
获取所述树形结构中的所有所述叶子节点;
提取所述叶子节点的类别信息、均衡比数据及样本数信息;
根据所述类别信息、所述均衡比数据及所述样本数信息对当前叶子节点进行分类;
获取当前所述叶子节点的所述节点类型数据,循环执行直至将所有所述叶子节点分类为单类别叶节点、类别均衡叶节点和含有异常样本叶节点。
4.根据权利要求1所述的方法,其特征在于,所述根据所述节点类型数据处理聚类树模型中的所述叶子节点,完成欺诈交易检测,包括:
获取所述节点类型数据,根据所述节点类型数据选取节点的适用处理方式,所述适用处理方式包括结合聚类模型、异常检测方法以及决策树分类模型的思想,通过层次化聚类的方式构建一棵决策树模型;
根据所述适用处理方式遍历处理所述树形结构中的所述叶子节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811522918.7/1.html,转载请声明来源钻瓜专利网。