[发明专利]基于注意力机制的图分类方法及化合物毒性预测方法有效
申请号: | 202011637474.9 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112733918B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 高建良;高俊 | 申请(专利权)人: | 中南大学;赛尔网络有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06N3/042;G06N3/0499;G06N3/082 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 分类 方法 化合物 毒性 预测 | ||
1.一种化合物毒性预测方法,具体包括如下步骤:
A.将化合物分子表示为原始图:节点对应于原子,边对应于原子对之间存在的化学键;
B.根据步骤A获取的原始图网络及数据信息,初始化节点的特征嵌入、构建高阶图网络并初始化高阶图网络中的节点嵌入;
在具体实施时,采用如下步骤初始化节点的特征嵌入:
对于给定的图网络G,用V(G)表示图G的节点集,E(G)表示图G的边集;节点i∈V(G)和边(i,j)∈E(G)都具有属性;将节点i∈V(G)的属性编码为ui的嵌入特征,N(i)={j|(i,j)∈E(G)}表示节点i的邻居节点,|N(i)|表示节点i的邻居节点个数;使用节点的标签和属性初始化节点嵌入:对于节点i∈V(G),通过分别连接基于节点的标签和属性,并生成的两个单热向量和来初始化嵌入ui,其中d=d1+d2,||为连接符号;
采用如下步骤构建高阶图网络:
对于给定的整数k≥2,将给定的一阶化合物分子图网络G中构成连通子图的任意k个不同节点表示为Ck={v1,v2,...,vk};然后,将Ck表示为k阶化合物分子图网络中的一个节点;所有Ck组成k阶化合物分子图网络的节点集并记为V(G)k;定义k阶化合物分子图网络的节点Ck的邻域为N(Ck)={Tk∈V(G)k|(|Ck∩Tk|)=k-1},其中|Ck∩Tk|为与Ck和Tk相交的节点数;若Tk为Ck的邻居,则有一条边(Ck,Tk)存在于Ck和Tk之间,且令所有这些边组成k阶化合物分子图网络的边集并记为E(G)k,k阶图网络Gk表示为(V(G)k,E(G)k);从而构造一个k阶化合物分子图网络,其中每个节点代表一个k阶子结构;
采用如下步骤初始化节点嵌入:
对于k阶化合物分子图网络中的节点Ck,采用k-1阶化合物分子图网络的特征嵌入作为初始特征u(Ck):其中u(Ck)表示k阶化合物分子图网络中节点Ck的初始特征,u(Ck-1)表示Ck-1在k-1阶图网络中的特征;对于Ck,有k-1个节点组成连通子图的组合是Ck的子集;N为子结构的个数;k为正整数且k≥2;
C.各阶化合物分子图网络中的节点,采用子结构交互注意力网络SIA,捕获吸收邻居节点信息,捕获吸收邻居节点间的交互信息,并训练得到化合物分子图网络中每个节点的新的特征嵌入;
具体实施时,采用如下步骤进行捕获吸收:
设定k阶化合物分子图网络中的每个节点Ck为一个k阶子结构,并被赋予一个基本子结构侵入向量u(Ck)∈Rd,其中d表示特征维数;化合物分子相邻子结构聚合用于融合相邻子结构信息,中心子结构a将相邻子结构b,c,d,e,f的信息聚集于本身;相邻子结构聚合的迭代公式如下式所示:
式中Tk∈N(Ck)为节点Ck在k阶化合物分子图网络中的邻居;W1∈Rd'×d为每个节点的共享权值矩阵,d'为每个节点的输出维数;α(Ck,Tk)为注意系数,且计算公式为
其中f(u(Ck),u(Tk))为表示u(Ck)和u(Tk)的相容性的标量,通过单隐层前馈网络并采用如下公式计算
a∈Rr为生成标量值的权值向量,tanh为激活函数,W2∈Rr×2d为权值矩阵,表示u(Ck)和u(Tk)的连接,b∈Rr为偏置,r为常数且表示隐含层的维数;
采用如下步骤进行捕获吸收:
聚合化合物分子图中相邻子结构的相互作用信息,中心子结构a将相邻子结构c、d的交互信息以及b、f间的交互信息聚集于本身;迭代公式如下式:
式中u(Ck)'ia为节点Ck的邻居交互表示,u(Tk)为节点Tk的表示,u(Sk)为节点Sk的表示,⊙为哈玛达积;β(Tk,Sk)为节点Tk和Sk之间的交互作用系数,且计算公式为
采用如下算式进行归一化:
式中(Mk,Qk)为k阶化合物分子图中的一条边,且满足Mk和Qk均为Ck的邻居,E(G)k为k阶化合物分子图网络的边集;
采用如下步骤获取新的特征嵌入:
融合邻居节点信息和邻居节点间的交互信息,获得节点嵌入u(Ck);节点嵌入u(Ck)的迭代表示式为u(Ck)'=σ(αu(Ck)'sa+(1-α)u(Ck)'ia),其中u(Ck)'sa为邻居聚合得到的新节点嵌入,u(Ck)'ia为邻居相互作用聚合得到的新节点嵌入,σ为sigmoid激活函数;
D.采用节点注意力网络SNA将图网络中的节点特征嵌入融合成化合物分子图网络嵌入,并级联各阶图网络嵌入,再通过多层感知机将级联后的图网络嵌入进行降维分类,从而得到最终的图网络分类结果;
具体实施时,采用如下步骤获取图网络嵌入:
利用注意机制学习每个化合物分子图网络子结构a,b,c,d,e,f的权值Score(a),Score(b),...,Score(f),然后通过学习子结构的权值将子结构嵌入融合为化合物分子图网络嵌入;设定S(G)为化合物分子图网络G中子结构的集合,S(G)∈RN×d表示对应子结构嵌入的集合,N为子结构的个数,un∈R1×d表示子结构n∈S(G)的嵌入,然后通过如下算式计算得到图级嵌入hG:
式中σ为激活函数且为un的转置;ReLU为激活函数;W3∈Rd×d为子结构嵌入的可学习权矩阵;
采用如下步骤获取最终的图网络分类结果:
对于k阶化合物分子图网络对应的图网络的嵌入将各阶化合物分子图网络对应的化合物分子图网络嵌入按递增顺序级联,得到最终的高阶化合物分子图网络嵌入然后将生成的化合物分子图网络嵌入FG输入至多层感知机MLP层,从而得到最终的预测化合物分子图网络标签
E.得到的最终的化合物分子所对应的图的分类结果,对应于最终的化合物毒性预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学;赛尔网络有限公司,未经中南大学;赛尔网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011637474.9/1.html,转载请声明来源钻瓜专利网。