[发明专利]一种基于超图分割的金融欺诈团伙识别方法在审
申请号: | 202110058766.5 | 申请日: | 2021-01-16 |
公开(公告)号: | CN112667863A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 张涛;张宗旺 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/215;G06F16/9035;G06F16/907 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 超图 分割 金融 欺诈 团伙 识别 方法 | ||
本发明公开了一种基于超图分割的金融欺诈团伙识别方法,本发明将超图分割过程分解为6个子过程:特征提取、数据规范化处理、数据清洗、数据存储、指标选取及通话网络构建、邻接矩阵构建、非负矩阵分解、获取结果。本发明基于一边多节点超图的概念进行实现,超图的性质可使模型获得全局最优解的近似值,而当前的团伙欺诈识别方案大多是基于传统图的算法,只能考虑的局部最优解。而团伙检测领域,更加依赖全局最优解。对于高纬度计算的方案,提出在非负矩阵分解的损失函数中,加入超图正则项,可以对高维信息进行编码,提升迭代效率。
技术领域
本发明属于金融反欺诈和机器学习相关领域,是识别金融欺诈团伙的一种有效方法。
背景技术
在互联网金融领域,欺诈行为是造成出借机构损失的最主要因素,研究发现,信贷欺诈行为往往是团伙作案,这些团伙直接必然又存在千丝万缕的联系。
以运营商数据来分析客户的社交行为,发现欺诈团伙的痕迹的方法是比较可行于有效的,但运营商通信数据往往十分巨大,一般统计方法是无法进行有效分析,需借助机器学习技术,进行客群分区,寻找欺诈团伙。超图打破普通描述二元关系的图,一个超边可以包含多个顶点,更适用于描述多元关系。到目前为止,尚未有基于超图的高效的社区分割方法应用于金融反欺诈领域。
超图(Hypergraph)是一种广义上的图,它的一条边可以连接任意数量的顶点。而普通图一条边只有两个顶点。将普通图扩展到超图的同时,会使节点间的关系变为高阶。基于非负矩阵因子化分解的办法可以将网络投影到潜在的低维空间中,一来可以对结果进行判别性表示;二来可以使计算变得高效可行。
发明内容
本发明要解决的技术问题是,提供一种基于超图分割的金融欺诈团伙识别方法,以解决传统方法由于使用普通图而仅考虑到局部可行性的局限和针对高阶信息网络如何高效计算的问题。由个体间的通话记录构建信息网络,通过超图分割的方法对网络进行聚合。由于团伙欺诈有聚集性的特点,即可获取团伙识别的结果。
为解决上述问题,本发明采用如下的技术方案:
一种基于超图分割的金融欺诈团伙识别方法,包括以下步骤:
步骤S1、特征提取:从通话记录的原始数据中,提取出联系人ID、通话时长、通话次数等因子形成JSON串的形式,方便接下来的数据处理;
步骤S2、数据规范化处理:第一种规则是,当主叫ID与被叫相同时,不符合规范,删除记录;第二条规则是,结束时间-开始时间≠通话时长或者结束时间早于开始时间,删除记录;
步骤S3、数据清理:将骚扰、快递、送餐、推销类、无效号码、服务类号码等通话记录删除。以上的干扰性通话记录会促使本来无关的联系人ID直接成团,从而干扰团伙识别的结果;
步骤S4、数据存储:将清理后的数据存储至JanusGraph中,便于系统级别的开发;
步骤S5、指标选取及通话网络构建:以联系人ID作为网络的结点,通话关联作为网络的边,选取通话次数、时长、信息熵、时间区间等指标的通话信息网络构建完毕;
步骤S6:邻接矩阵的构建:根据S5中的指标,通过AHP计算权重,根据权重构造无向图的邻接矩阵,其中权值∈[0,1];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110058766.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种注塑机用射胶电动传动设备
- 下一篇:一种装配式墙板