[发明专利]基于注意力机制的图分类方法及化合物毒性预测方法有效
申请号: | 202011637474.9 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112733918B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 高建良;高俊 | 申请(专利权)人: | 中南大学;赛尔网络有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06N3/042;G06N3/0499;G06N3/082 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 分类 方法 化合物 毒性 预测 | ||
本发明公开了一种基于注意力机制的图分类方法,包括获取原始图网络及对应的图网络数据信息;初始化节点的特征嵌入、构建高阶图网络并初始化高阶图网络中的节点嵌入;各阶图网络中的节点采用子结构交互注意力网络捕获吸收邻居节点信息和邻居节点间的交互信息并训练得到图网络中每个节点的新的特征嵌入;采用节点注意力网络将图网络中的节点特征嵌入融合成图网络嵌入,级联各阶图网络嵌入后通过多层感知机将降维分类并得到最终的图网络分类结果。本发明还公开了一种包括所述基于注意力机制的图分类方法的化合物毒性预测方法。本发明有效提高了图网络分类的准确度和化合物毒性预测的准确度;而且效率较高、准确性较好且易于实施。
技术领域
本发明属于图数据挖掘领域,具体涉及一种基于注意力机制的图分类方法及化合物毒性预测方法。
背景技术
图分类作为图挖掘领域中的一个重要分支,已经被应用到了许多实际领域。判断DNA蛋白质序列是否突变,预测未知的化合物是否具有毒性,根据社交群体的内部结构属性对社群进行类别判断等,都可以抽象为图分类问题。例如,在化学领域,化学家们利用图对化合物结构建模,用图中的顶点来表示化合物中的分子,用图中的边来表示分子之间的化学键,通过对化合物图集的挖掘,可以发现化合物结构之间的内在关系,帮助找到那些频繁出现、且与有毒化合物具有相同子结构的物质。在社交网络的挖掘中,可以将整个社会抽象为一个网络拓扑图,每一个个体或组织可以表示为图中的顶点,而图中的边则可以表示个体或组织之间的复杂联系,这样对社会人群的分析,就可以转化为对社交网络拓扑图的挖掘。
近年来,图神经网络(GNN)已广泛用于图的表示学习,并在图分类任务中表现出较好的结果。亚历克斯·克里热夫斯基等将吸收邻近节点信息的思想应用于神经网络并提出卷积神经网络(CNN)。随后,Kipf等人提出了图卷积网络(GCN),通过将CNN应用于具有分层传播规则的图数据中,从而对图结构和节点特征进行编码。在图分类中,最近的一种方法DGCNN采用空间图卷积层来提取多尺度节点特征。该方法保留了多层卷积过程中节点嵌入的信息,并取得了较好的分类效果。为了考虑不同邻居节点在信息聚合过程中的影响,Velickovic提出了基于GCN的图注意力网络(GAT)。GAT模型利用注意机制计算注意系数,表示不同邻居节点对中心节点的重要性。随后,注意机制的一些变体,可以自适应地处理可变大小的数据,并鼓励模型将重点放在数据中最突出的部分上。
图结构中的各种子结构通常倾向于显示不同的信息,这些子结构可用于图嵌入和图分类。但是这些模型存在不足:一方面,GAT及其变体只关注单个节点(一阶),这限制了它们在图分类应用中的准确性;另一方面,这些高阶模型仅使用邻接矩阵或其变体线性吸收邻居的信息,在处理复杂的非线性数据(例如邻居之间的交互信息)时存在困难;而且这些非线性数据不能通过现有的卷积运算直接吸收,但是它们包含的信息将影响图信息的表示,因此造成模型在精确度上存在缺陷。
发明内容
本发明的目的之一在于提供一种效率较高、准确性较好且易于实施的基于注意力机制的图分类方法。
本发明的目的之二在于提供一种包括了所述基于注意力机制的图分类方法的化合物毒性预测方法。
本发明提供的这种基于注意力机制的图分类方法,包括如下步骤:
S1.获取原始图网络及对应的图网络数据信息;
S2.根据步骤S1获取的原始图网络及数据信息,初始化节点的特征嵌入、构建高阶图网络并初始化高阶图网络中的节点嵌入;
S3.各阶图网络中的节点,采用子结构交互注意力网络SIA,捕获吸收邻居节点信息,捕获吸收邻居节点间的交互信息,并训练得到图网络中每个节点的新的特征嵌入;
S4.采用节点注意力网络SNA将图网络中的节点特征嵌入融合成图网络嵌入,并级联各阶图网络嵌入,再通过多层感知机将级联后的图网络嵌入进行降维分类,从而得到最终的图网络分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学;赛尔网络有限公司,未经中南大学;赛尔网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011637474.9/2.html,转载请声明来源钻瓜专利网。