[发明专利]一种图数据节点分类方法及装置有效
申请号: | 202110434137.8 | 申请日: | 2021-04-22 |
公开(公告)号: | CN112990364B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 寇广;易晓东;王之元;胡志辉;张浩宇 | 申请(专利权)人: | 中国人民解放军军事科学院国防科技创新研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京云科知识产权代理事务所(特殊普通合伙) 11483 | 代理人: | 张飙 |
地址: | 100070 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 节点 分类 方法 装置 | ||
本发明公开了一种图数据节点分类方法及装置,所述方法包括以下步骤:S1,获取图结构数据,所述图结构数据包括特征信息和拓扑结构信息;S2,以聚类的方式学习图节点的隐藏层表征,针对图节点的隐藏层表征构建最优化模型;S3,求解最优化模型,得到图节点的新表征;S4,根据节点的新表征执行图节点分类,构建新的神经网络结构。根据本发明的基于节点相似性的图数据节点分类方法和装置极大提高了图节点分类的正确率。
技术领域
本发明涉及人工智能领域,具体涉及处理图数据的机器学习技术,尤其是基于节点相似性的图数据节点分类方法及装置。
背景技术
节点分类任务即给定图中某些节点对应的类别,从而预测出没有标签的类别属于哪一个类别。现有的技术方法可以大致分为以下几种:
一、概率关系分类
概率关系分类器的核心思想是某节点的标签是其邻居节点的对应标签的概率的均值。首先,初始化已经存在标签的节点的分布概率,正例是1,负例是0,对于没有标签的节点概率全部设置为0.5,然后对所有没有标签的节点进行概率更新,直至收敛或者更新到最大的迭代次数。
二、迭代分类
迭代分类实质上就是考虑节点关系的同时也考虑节点的属性。首先,对于每个节点创建一个特征向量,然后利用节点的特征向量来训练分类器,如果一个节点有多个邻居节点,则需要做一个聚合操作,计算其数量、众数、比例、均值以及是否存在邻居等。训练分类器的方式和概率分类相似,不停的迭代更新每一个节点的标签,在更新节点标签的同时节点对应的特征向量也需要更新,直到生成的标签稳定或者达到最大的迭代次数。
三、图卷积网络分类
受传统的深度学习方法启发,图卷积网络是一类在处理非欧几里得数据上取得优良效果。图卷积网络致力于在一个低纬向量空间进行网络节点表示,同时保护网络拓扑结构和节点信息,能够使用简单现成的机器学习算法等作用于下游任务。Kipf和Welling等人提出了标准的GCN[1]用于节点的半监督分类。对于无向图,定义图卷积算子如式(1)所示:
(1)
此时,是图的邻接矩阵,是图节点的初始特征矩阵,是在第层的模型参数,是第层的输出,,是ReLU激活函数。除此之外,是归一化的邻接矩阵,是度矩阵有。
上述三种现有的图节点分类技术存在以下缺点:
(1)概率关系分类忽略了图节点的属性信息,不同的节点包含的属性信息不同,忽略图节点的属性信息而只考虑图的拓扑信息必然导致图分类的不准确。
(2)概率关系分类和迭代分类都不能保证算法收敛,模型可能陷入局部最优解中。
(3)现有的图卷积网络模型不能充分利用图的连接信息。图的连接信息反映了节点对的相似关系。理想情况下,连接的节点需要有相似的表征,但是现有的图卷积网络模型在节点特征聚合过程中往往会破坏节点相似性,这降低了图的节点分类的正确率。
发明内容
针对现有技术存在的问题,本发明的目的在于解决用于图数据的机器学习方法无法精确的挖掘节点之间的相似关系的问题。本发明提出一种结合图神经网络、聚类算法和最优化模型的方法和装置对图数据进行建模,深挖节点之间的相似性,得到节点的精确表征,利用得到的节点表征,可以为在图数据执行节点分类,提高了图节点分类的正确率。
根据本发明的基于节点相似性的图数据节点分类方法,包括以下步骤:
S1,获取图结构数据,所述图结构数据包括特征信息和拓扑结构信息;
S2,以聚类的方式学习图节点的隐藏层表征,针对图节点的隐藏层表征构建最优化模型;
S3,求解最优化模型,得到图节点的新表征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院国防科技创新研究院,未经中国人民解放军军事科学院国防科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110434137.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置