[发明专利]一种基于深层图神经网络的分子表示方法及系统在审
申请号: | 202211560221.5 | 申请日: | 2022-12-06 |
公开(公告)号: | CN116504333A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 魏骁勇;田奇;杨震群;曹溢;黄文禹;严丽巧 | 申请(专利权)人: | 四川大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/50;G06N3/0464;G06N3/08 |
代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 袁宇霞 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深层 神经网络 分子 表示 方法 系统 | ||
本发明公开了一种基于深层图神经网络的分子表示方法及系统,涉及人工智能技术领域,尤其涉及生物计算、深度学习技术领域,解决现有技术过平滑导致图神经网络无法增加图卷积次数以增加结点感受野的问题。本发明调用第三方库将分子的计算机存储数据转化为分子图,分子图包括邻接矩阵、结点和边;分析分子图得到分子图的结点和边的初始特征向量;基于图神经网络和邻接矩阵对结点和边的初始特征向量进行密集残差图卷积运算,得到新的结点和边的特征向量;对新的结点和边的特征向量进行池化操作,得到分子表示。本发明用于分子表示。
技术领域
一种基于深层图神经网络的分子表示方法及系统,用于分子表示,涉及人工智能技术领域,尤其涉及生物计算、深度学习技术领域。
背景技术
目前主流的分子表示方法有三种。第一种使用化学-化学相互作用和结构相似性的信息构建特征矩阵,当需要预测时直接取出矩阵中对应的行列作为分子表示。第二种是使用分子的SMILES表示法或是分子扩展连通性指纹ECFP,将分子表示为一个Token序列,使用自然语言处理NLP领域的相关方法预测分子性质或做分子设计。这两种方法都有一个显著的缺陷,分子作为一种非欧数据,无法显式的表征空间拓扑性质。第三种方法基于图神经网络,以化学小分子为例,将原子视为图上结点,化学键视为边,构建分子图,利用图上的卷积和读出算法,就可以得到整张图的嵌入特征,作为分子的表示。
图神经网络具有过平滑问题:
当前的图神经网络,主要基于消息传递框架,信息的传递依赖于聚合和更新操作。一个结点,主要从周围的邻居结点获取特征表示,进而更新自身的特征表示,这导致相邻结点趋向于具有相近的表示。当网络层数加深时,随着传播次数的增加,整张图的各结点信息也将趋同,缺乏不同结点的区分度,所以,深层的图神经网络反而会导致任务性能下降。
采用注意力机制延缓过平滑存在的问题:
已有技术采用计算注意力的方式改进消息传递机制,增大自身结点在传递消息时的权重,以减少过度的消息传递,从而在一定程度上克服过平滑问题。但是,为每个结点计算注意力权重会导致大量的算力消耗,并且网络层数加深之后,虽然每次传递时的系数较低,但消息传递次数增多后依然具有过平滑问题。此类方案仅通过自适应权重来延缓过平滑问题,但网络加深后计算量爆炸且平滑问题再次显现。
拓展图上深层结构的重要性:
合理的做深神经网络,有益于性能增强,这是深度学习领域的普遍共识。在图深度学习中,一次图卷积可以聚合邻居结点的信息,想要获得更远结点的信息,就必须增加图卷积次数以增加结点感受野,但过平滑问题导致图神经网络无法做深,极大限制网络的表达能力,限制分子表示的生成质量。因此,亟待一种基于深层图神经网络的生物化学分子表示方法。
虽然《基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法》也克服过平滑的问题,但仍然存在如下技术问题:
1.没有很好的解决过平滑问题。过平滑导致图神经网络无法增加图卷积次数以增加结点感受野,现有的注意力改进方案只能延缓过平滑问题,加深网络后过平滑问题将重现,极大限制网络的表达能力,从而造成分子表示的生成质量不佳的问题v
2.网络层数较浅。只能用浅层网络抽取分子表示,结点感受野较小,从而造成信息传递融合不充分;
3.计算复杂度高。现有的基于注意力的方案,需要在每一个结点接收消息时,为邻居赋权重,虽然有益于性能提升,但会增加大量计算量。
发明内容
针对上述研究的问题,本发明的目的在于提供一种基于深层图神经网络的分子表示方法及系统,解决现有技术过平滑导致图神经网络无法增加图卷积次数以增加结点感受野,现有的注意力改进方案只能延缓过平滑问题,加深网络后过平滑问题将重现,极大限制网络的表达能力,从而造成分子表示的生成质量不佳的问题。
为了达到上述目的,本发明采用如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211560221.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:双轴承绕线轮
- 下一篇:一种对甘蔗渣进行快速炭化的方法