[发明专利]一种基于图分类的套利团伙识别方法在审
申请号: | 202111464780.1 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114387005A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 余杰潮;徐德华;汤敏伟;李真 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2458;G06F16/901;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 套利 团伙 识别 方法 | ||
1.一种基于图分类的套利团伙识别方法,其特征在于,包括以下:
S1:获取数据预处理,抽取构图的实体和关系,构建知识图谱;
S2:对构建好的图谱,利用连通子图算法进行群组划分;
S3:计算每个群组的风险指标信息,形成业务风险评分;
S4:搭建并训练深度图卷积神经网络,用于预测群组的结构风险评分;
S5:综合业务风险评分和结构风险评分计算群组的综合风险评分,筛选风险群组;
上述的步骤S1,包含:
S1.1:从业务数据表中获取原始交易数据和操作数据,进行数据清洗等预处理工作,抽取构图所需的实体和关系信息。实体包括:账户、商户、设备、IP等;关系包括:消费,登录,转账,提现等;
S1.2:根据步骤S1.1中抽取的实体和关系,将数据导入图数据库Neo4j构建图谱,或使用Networkx等构图工具构图,当数据量较大时Neo4j的性能明显优于Networkx;
上述的步骤S2,包含:
S2.1:基于步骤S1.2中构建的图谱,采用连通子图算法在全图上进行子图划分,形成一个个彼此之间互相割裂,但内部联系紧密的群组;
上述的步骤S3,包含:
S3.1:根据步骤S2.1划分的用户群组,使用FP-growth频繁集挖掘算法,计算群组中用户的聚集度指标,得到聚集度评分;
S3.2:基于步骤S3.1的聚集度指标和现有的用户黑名单、设备黑名单等,计算群组的风险程度评分;
S3.3:基于步骤S3.1和步骤S3.2中得到的聚集度评分和风险程度评分,计算群组总的业务风险评分;
上述的步骤S4,包含:
S4.1:搭建深度图卷积神经网络,模型可以接受任意的图作为输入而不限制图的结构和节点数量,基于部分标签群组训练神经网络。
S4.2:基于步骤S4.1的训练好的神经网络,将步骤S1.2中得到的用户群组作为输入,得到每个群组是否是套利群组的概率,将该概率处理后作为每个群组的结构风险评分;
上述的步骤S5,包含:
S5.1:基于步骤S3和步骤S4中得到的群组业务风险评分和群组结构风险评分,计算每个群组的综合风险评分,筛选群组综合风险评分大于一定阈值的群组或取前TOPN的群组,作为风险群组输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111464780.1/1.html,转载请声明来源钻瓜专利网。