[发明专利]一种区块链二部图不平衡数据集上的无监督异常用户检测方法在审

专利信息
申请号: 202211404580.1 申请日: 2022-11-10
公开(公告)号: CN115841332A 公开(公告)日: 2023-03-24
发明(设计)人: 王军杰;李涤非;张子牛;刘震 申请(专利权)人: 电子科技大学
主分类号: G06Q20/40 分类号: G06Q20/40;G06Q20/06;G06Q40/04;G06F18/243;G06N3/0455;G06N3/0499;G06N3/084
代理公司: 电子科技大学专利中心 51203 代理人: 陈一鑫
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 区块 二部 不平衡 数据 监督 异常 用户 检测 方法
【说明书】:

发明公开了一种区块链二部图不平衡数据集上的无监督异常用户检测方法,涉及信息技术领域,尤其涉及区块链交易数据,实现了一种二部图不平衡数据集上的无监督异常用户检测方法;通过基于模式挖掘的图异常检测算法根据图数据集的全局结构,对数据集中的所有用户节点进行标注;然后通过异常值补偿方法(Anomaly Value Compensation,AVC)优化的铰链损失函数进行训练,根据节点的标签和原始的特征向量生成低维向量表示,并将生成结果输入到前馈神经网络中进行二分类,实现对数据集中异常节点的检测。通过计算测试集的精确率(Precision),召回率(Recall)和F1值,并根据得到的F1值衡量异常用户检测效果的优劣。

技术领域

本发明涉及信息技术领域,尤其涉及一种不平衡区块链交易数据上的无监督异常用户检测方法。

背景技术

图数据集上异常检测模型主要分为两类。一类是基于全局属性进行异常结构检测的模式挖掘算法;另一类主要利用图神经网络模型(GNN)对局部邻域信息进行特征聚合的特征学习方法。然而,单独使用其中一种方法时往往无法兼顾到图结构在全局和邻域上所表征出的信息,导致效果往往不尽如人意。因此现在趋向于结合两类模型实现更有效的异常检测。

异常检测方法面临的一个重大挑战是数据中的少数类与多数类存在样本数量差别极大的问题(数据不平衡问题),如在区块链数据中,异常用户群体数目远低于正常用户群体,这样造成了如果不能充分处理好不平衡数据中模型的训练方式,最终会造成模型会对少数类的异常用户产生过拟合而无法准确监测处异常用户。并且数据样本个体的邻域特征分布情况也不尽相同,例如对于一个少数类群体的边缘节点,其邻居节点中多数节点或与自身并不属于同一类。如果在区块链交易数据对应的用户-商品二部图上,不充分考虑这些情况,则会大大增加这些用户节点被误判的可能性。在不平衡数据集中存在的易被误判节点严重影响着最终模型的检测精度。

而对以上问题,现有针对不平衡数据集的模型训练方法多使用欠采样/过采样方式避免不平衡数据集上模型训练会出现的问题,或是通过人工生成少数类节点数据对象来进行规避。但针对在不平衡数据集训练无监督学习模型的有效方法似乎还没有较好的解决方式,即使是对这个问题做了针对性改进并且取得较好效果的PAMFUL模型也只是将不平衡数据集中各不平衡类节点群体视为一个整体,对群体中个体总数在训练过程中进行一定补偿避免过拟合情况的出现。但这样的处理方式也并未充分挖掘二部图中各个节点的邻域拓扑结构信息,不可避免地造成了对易被误判节点的检测准确度不足的问题,从而也大大限制了PAMFUL模型在无标签的区块链交易数据上异常用户的检测精度。

发明内容

为了解决现有模型在无标签的不平衡数据集上遇到的问题,尤其是识别检测易被误判用户节点时存在的困难和挑战,本发明提供了一种区块链交易数据的无监督异常用户检测方法,拟通过充分挖掘二部图中各节点邻域拓扑结构信息,对不同类型的节点进行相应的补偿而避免出现模型训练的过拟合等情况,从而解决现有模型在无标签的二部图不平衡数据集中异常用户检测精度不足的问题。

一种针对区块链交易数据的无标签异常用户检测方法,其特征在于,包括以下步骤:

步骤1:根据区块链二部图不平衡数据集上的全局结构,使用基于模式挖掘的图异常检测算法来对全局中所有用户节点进行标签;

步骤2:将各个用户节点的原始特征向量和步骤S1得到的标签输入到基于特征学习的图编码器,再根据异常值补偿方法(Anomaly Value Compensation,AVC)优化的铰链损失函数训练图神经网络,得到各个节点的低维特征向量;

步骤3:将图编码器输出的各个节点的低维特征向量输入到前馈神经网络当中进行二分类,实现对异常用户的检测,并计算出该不平衡数据集中模型对测试集的F1值,根据F1值衡量检测效果。

优选的,所述步骤1主要任务为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211404580.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top