[发明专利]一种区块链二部图不平衡数据集上的无监督异常用户检测方法在审
申请号: | 202211404580.1 | 申请日: | 2022-11-10 |
公开(公告)号: | CN115841332A | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王军杰;李涤非;张子牛;刘震 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06Q20/06;G06Q40/04;G06F18/243;G06N3/0455;G06N3/0499;G06N3/084 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 陈一鑫 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 区块 二部 不平衡 数据 监督 异常 用户 检测 方法 | ||
本发明公开了一种区块链二部图不平衡数据集上的无监督异常用户检测方法,涉及信息技术领域,尤其涉及区块链交易数据,实现了一种二部图不平衡数据集上的无监督异常用户检测方法;通过基于模式挖掘的图异常检测算法根据图数据集的全局结构,对数据集中的所有用户节点进行标注;然后通过异常值补偿方法(Anomaly Value Compensation,AVC)优化的铰链损失函数进行训练,根据节点的标签和原始的特征向量生成低维向量表示,并将生成结果输入到前馈神经网络中进行二分类,实现对数据集中异常节点的检测。通过计算测试集的精确率(Precision),召回率(Recall)和F1值,并根据得到的F1值衡量异常用户检测效果的优劣。
技术领域
本发明涉及信息技术领域,尤其涉及一种不平衡区块链交易数据上的无监督异常用户检测方法。
背景技术
图数据集上异常检测模型主要分为两类。一类是基于全局属性进行异常结构检测的模式挖掘算法;另一类主要利用图神经网络模型(GNN)对局部邻域信息进行特征聚合的特征学习方法。然而,单独使用其中一种方法时往往无法兼顾到图结构在全局和邻域上所表征出的信息,导致效果往往不尽如人意。因此现在趋向于结合两类模型实现更有效的异常检测。
异常检测方法面临的一个重大挑战是数据中的少数类与多数类存在样本数量差别极大的问题(数据不平衡问题),如在区块链数据中,异常用户群体数目远低于正常用户群体,这样造成了如果不能充分处理好不平衡数据中模型的训练方式,最终会造成模型会对少数类的异常用户产生过拟合而无法准确监测处异常用户。并且数据样本个体的邻域特征分布情况也不尽相同,例如对于一个少数类群体的边缘节点,其邻居节点中多数节点或与自身并不属于同一类。如果在区块链交易数据对应的用户-商品二部图上,不充分考虑这些情况,则会大大增加这些用户节点被误判的可能性。在不平衡数据集中存在的易被误判节点严重影响着最终模型的检测精度。
而对以上问题,现有针对不平衡数据集的模型训练方法多使用欠采样/过采样方式避免不平衡数据集上模型训练会出现的问题,或是通过人工生成少数类节点数据对象来进行规避。但针对在不平衡数据集训练无监督学习模型的有效方法似乎还没有较好的解决方式,即使是对这个问题做了针对性改进并且取得较好效果的PAMFUL模型也只是将不平衡数据集中各不平衡类节点群体视为一个整体,对群体中个体总数在训练过程中进行一定补偿避免过拟合情况的出现。但这样的处理方式也并未充分挖掘二部图中各个节点的邻域拓扑结构信息,不可避免地造成了对易被误判节点的检测准确度不足的问题,从而也大大限制了PAMFUL模型在无标签的区块链交易数据上异常用户的检测精度。
发明内容
为了解决现有模型在无标签的不平衡数据集上遇到的问题,尤其是识别检测易被误判用户节点时存在的困难和挑战,本发明提供了一种区块链交易数据的无监督异常用户检测方法,拟通过充分挖掘二部图中各节点邻域拓扑结构信息,对不同类型的节点进行相应的补偿而避免出现模型训练的过拟合等情况,从而解决现有模型在无标签的二部图不平衡数据集中异常用户检测精度不足的问题。
一种针对区块链交易数据的无标签异常用户检测方法,其特征在于,包括以下步骤:
步骤1:根据区块链二部图不平衡数据集上的全局结构,使用基于模式挖掘的图异常检测算法来对全局中所有用户节点进行标签;
步骤2:将各个用户节点的原始特征向量和步骤S1得到的标签输入到基于特征学习的图编码器,再根据异常值补偿方法(Anomaly Value Compensation,AVC)优化的铰链损失函数训练图神经网络,得到各个节点的低维特征向量;
步骤3:将图编码器输出的各个节点的低维特征向量输入到前馈神经网络当中进行二分类,实现对异常用户的检测,并计算出该不平衡数据集中模型对测试集的F1值,根据F1值衡量检测效果。
优选的,所述步骤1主要任务为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211404580.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置