[发明专利]融合元路径的分子异质图性质预测方法、存储介质及装置在审
申请号: | 202310516357.4 | 申请日: | 2023-05-09 |
公开(公告)号: | CN116646021A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 杜博;纪颖;万国佳 | 申请(专利权)人: | 武汉大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G16C20/50 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 张凯 |
地址: | 430000*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 路径 分子 异质图 性质 预测 方法 存储 介质 装置 | ||
1.一种融合元路径的分子异质图性质预测方法,其特征在于,具体包括以下步骤:
将每个分子建模为异质图,且异质图中包括节点集合、边集合、节点类型集合和边类型集合;
预定义一个元路径模板库,且一个元路径建模一种化学基团的路径结构,以进行节点类型和边缘类型描述;
基于元路径进行分子图的局部路径结构的学习,并在分子图上构建基于元路径的原子连接后,根据边的类型将异质图分解成不同的关系子图,每个关系子图均只包含一种边类型的同质图;
对于每个关系子图,将关系子图的邻接矩阵和节点向量输入邻居注意力模块,以实现节点的嵌入向量的更新;
将所有节点的表征输入关系关注力模块,学习不同类型关系的权重,将节点在不同关系子图下的特征向量按权相加,以更新所有节点的嵌入向量;
基于门控循环单元更新节点的嵌入向量,并基于读出函数将所有节点的嵌入向量读出成分子图的特征向量,输入至回归器预测得到属性值;
采用平均绝对误差作为损失函数,基于优化器求解最小损失得到最优模型参数,最小化损失函数直至模型收敛,输出模型,实现分子异质图性质预测。
2.如权利要求1所述的一种融合元路径的分子异质图性质预测方法,其特征在于,所述将每个分子建模为异质图,其中,对于异质图,具体表示为:
G=(V,E,M,R)
其中,G表示异质图,V表示节点集合,E表示边集合,M表示节点类型集合,R表示边类型集合,一个原子被表示为一个节点v,且v∈V,一个边e用于描述两个原子之间的化学键,即两个节点之间的化学键,节点类型映射为V→M,边类型映射φ为E→R。
3.如权利要求1所述的一种融合元路径的分子异质图性质预测方法,其特征在于,所述基于元路径进行分子图的局部路径结构的学习,具体步骤包括:
给定一个分子图,对所有预定义的元路径模板执行BFS图遍历算法,匹配出当前分子图中所有的元路径实例;
通过连接每个元路径实例中的源节点和目标节点,构建元路径连接。
4.如权利要求1所述的一种融合元路径的分子异质图性质预测方法,其特征在于,所述对于每个关系子图,将关系子图的邻接矩阵和节点向量输入邻居注意力模块,以实现节点的嵌入向量的更新,具体步骤包括:
给定一个由r类型的边连接的原子对(vi,vj),将节点vi的特征向量由线性层将离散特征向量投射为连续向量hi,将节点vj的特征向量由线性层将离散特征向量投射为连续向量hj;
通过一个具有可学习权重wr的函数,将hi和hj转化为高维的隐藏嵌入向量,拼接后得到一个聚合的特征向量m;
在每个聚合的特征向量m上乘以一个注意力向量来实现邻居注意力策略,输出为每个邻居节点的重要性得分μ,μ用于说明在关系类型r下,邻居节点vi对节点vj的影响程度;
邻居节点的重要性得分μ使用Softmax函数,将邻接点的重要性得分转换成邻接点的影响系数α,具体的:
hi=Linear(xi),Wr=Linear(eij)
m=[Wrhi;Wrhj]
μ=ReLU(Wm)
其中,xi表示原始的节点特征向量,投射到一个连续向量hi中,eij表示原始的边特征向量,被转换和重塑为关系权重Wr,W表示一个权重矩阵,将拼接起来的的节点嵌入向量映射成一个重要性分数μ,Linear表示线性函数,ReLU表示激活函数;
汇总邻居信息来更新源节点vi的嵌入向量,将邻接节点嵌入与邻接点影响系数整合在一起,作为下一层的输入,具体的:
其中,h′表示下一层的输入,f表示激活函数,Ni表示节点vi的邻接节点集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310516357.4/1.html,转载请声明来源钻瓜专利网。