[发明专利]一种基于图分类的套利团伙识别方法在审
申请号: | 202111464780.1 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114387005A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 余杰潮;徐德华;汤敏伟;李真 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2458;G06F16/901;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 套利 团伙 识别 方法 | ||
本发明公开了一种基于图分类的套利团伙识别方法,包括以下:S1:获取数据预处理,抽取构图的实体和关系,构建知识图谱;S2:对构建好的图谱,利用连通子图算法进行群组划分;S3:计算每个群组的风险指标信息,形成业务风险评分;S4:搭建并训练深度图卷积神经网络,用于预测群组的结构风险评分。本发明采用连通子图算法对构建的图谱进行群组划分,可以使得套利团伙更容易被发现;采用深度图卷积神经网络对整个图进行分类,直接预测整个群组的风险;本发明不仅通过深度图神经网络判断群组的结构风险,同时还结合业务指标,使用频繁集挖掘算法分析群组的业务指标信息,计算业务风险评分,和业务数据相结合,增加了模型结果的可解释性。
技术领域
本发明涉及电子信息技术领域,特别涉及一种基于图分类的套利团伙识别方法。
背景技术
随着互联网技术的快速发展,给金融、电商等行业带来了新的机遇和挑战。平台和商家可以借助网络在线上发布各种优惠活动来吸引用户,增加流量,但却有这样一群人他们通过各种手段在多个平台套取营销活动的优惠,甚至已经形成了一条完整的产业链,称之为羊毛党或套利团伙。这些套利团伙给商家和平台造成了巨大的损失,据统计每年由于黑产套利造成的经济损失达到百亿。现有的识别套利团伙的方法主要还是以专家规则和传统的机器学习模型为主,专家规则虽然可解释性强,但是需要对历史风险事件的总结和归纳,而且总结的规则可能因人而异,一致性较差,响应速度慢。传统机器学习模型的识别维度主要是单用户或单商户,很难识别这种团伙性质的异常,因为往往从单个用户的维度看这些套利用户都没有问题,但是将一个套利团伙的用户放到一起异常却很明显。而图能够更加直接、自然地展现团伙内部的关联关系,在处理团伙识别问题上具有天然的优势。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于图分类的套利团伙识别方法,针对现有的套利团伙识别问题,提出一种有效的检测手段,具有较高的准确率和较好的鲁棒性。
本发明提供了如下的技术方案:
本发明提供一种基于图分类的套利团伙识别方法,包括以下:
S1:获取数据预处理,抽取构图的实体和关系,构建知识图谱;
S2:对构建好的图谱,利用连通子图算法进行群组划分;
S3:计算每个群组的风险指标信息,形成业务风险评分;
S4:搭建并训练深度图卷积神经网络,用于预测群组的结构风险评分;
S5:综合业务风险评分和结构风险评分计算群组的综合风险评分,筛选风险群组;
上述的步骤S1,包含:
S1.1:从业务数据表中获取原始交易数据和操作数据,进行数据清洗等预处理工作,抽取构图所需的实体和关系信息。实体包括:账户、商户、设备、IP等;关系包括:消费,登录,转账,提现等;
S1.2:根据步骤S1.1中抽取的实体和关系,将数据导入图数据库Neo4j构建图谱,或使用Networkx等构图工具构图,当数据量较大时Neo4j的性能明显优于Networkx;
上述的步骤S2,包含:
S2.1:基于步骤S1.2中构建的图谱,采用连通子图算法在全图上进行子图划分,形成一个个彼此之间互相割裂,但内部联系紧密的群组;
上述的步骤S3,包含:
S3.1:根据步骤S2.1划分的用户群组,使用FP-growth频繁集挖掘算法,计算群组中用户的聚集度指标,得到聚集度评分;
S3.2:基于步骤S3.1的聚集度指标和现有的用户黑名单、设备黑名单等,计算群组的风险程度评分;
S3.3:基于步骤S3.1和步骤S3.2中得到的聚集度评分和风险程度评分,计算群组总的业务风险评分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111464780.1/2.html,转载请声明来源钻瓜专利网。