[发明专利]基于图神经网络的蛋白质结构模型质量评估方法在审

专利信息
申请号: 202210557804.6 申请日: 2022-05-19
公开(公告)号: CN114997366A 公开(公告)日: 2022-09-02
发明(设计)人: 张沛东;沈红斌 申请(专利权)人: 上海交通大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G16B5/00;G16B40/00
代理公司: 上海交达专利事务所 31201 代理人: 王毓理;王锡麟
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 神经网络 蛋白质 结构 模型 质量 评估 方法
【说明书】:

一种基于图神经网络的蛋白质结构模型质量评估方法,提取待预测类蛋白质诱饵里所有167种重原子在三维空间中的全局坐标作为输入,对其通过Rosetta软件的dual‑space relax预处理后,解析计算得到原始节点特征和边特征并输入基于注意力机制和图池化技术构建的图神经网络模型,使用预训练好的模型网络参数进行计算,分别得到反映该类蛋白质诱饵结构在蛋白质水平和氨基酸残基水平上与真实天然蛋白结构的差距的全局得分和局部得分。本发明能够更有鉴别力地关注那些本身精度已接近天然结构的类蛋白质诱饵结构,从而提升蛋白质结构模型评估在高精度数据集上的准确性。

技术领域

本发明涉及的是一种生物工程领域的技术,具体是一种基于图神经网络的蛋白质结构模型质量评估方法,在未知对应天然结构的情况下评估模型结构的真实性。

背景技术

蛋白质结构模型评估旨在不知道天然结构的情况下,量化蛋白质结构预测模型产生的类蛋白质诱饵结构相对于其天然结构的准确性。对于涉及蛋白质的结构生物信息学来说,蛋白质结构模型评估工具是极其重要的基础设施,良好的评估方法能够为蛋白质结构预测,基于结构的蛋白质功能预测和基于结构的蛋白质分子对接等任务提供重要的指导。一般来讲,蛋白质结构模型评估分为多模型和单模型两类方法,前者需要将整个蛋白质结构模型池作为输入,通过将目标蛋白质结构模型与池中的其他模型进行比较并计算平均结构相似性作为质量指标来评估该蛋白质结构模型;后者仅使用单个诱饵结构本身的序列和结构信息作为输入来预测其质量。通常多模型方法在模型池中的大部分模型质量良好的情况下能够取得虚假的高精度,但耗时往往呈指数级增长;单模型方法性能可以更一致,并且更独立于待评估模型质量的分布,更贴近对于蛋白质结构模型评估算法的期望,即学习到该序列在自然条件下可能形成的真实结构。2020年,以谷歌最新AI算法AlphaFold 2为首的模型在官方组织的CASP 14结构预测大赛中证明,通过对氨基酸协同进化数据进行深度学习已经足以对所有未知结构的蛋白质序列预测出具有相当精度的类蛋白质诱饵结构。由于过往的评估技术倾向于识别出具有基本真实性的类蛋白质诱饵结构,大量高精度的类蛋白质诱饵结构的产生让几乎所有评估方法产生巨大的精度下滑。换言之,模型评估算法作为结构预测算法的重要指导部分,现有技术已经跟不上结构预测算法的飞速发展。

现有多模型质量评估方法拥有更长的耗时且精度大幅受蛋白质结构模型池本身分布的影响;单模型质量评估方法更贴近该领域问题的求解,但算法学习效果不佳;且现有几乎所有的质量评估方法在高精度蛋白模型中很难做出可靠的预测。

发明内容

本发明针对现有蛋白质结构模型评估方法在高精度蛋白质结构模型集上表现不佳的缺陷,提出一种基于图神经网络的蛋白质结构模型质量评估方法,将深度学习技术与蛋白质结构的领域知识相结合,将基于三重注意力机制构建的神经网络运用在蛋白质结构模型评估算法中,率先关注高精度蛋白质结构模型的评估并对此进行改进优化,能够更有鉴别力地关注那些本身精度已接近天然结构的类蛋白质诱饵结构,从而提升蛋白质结构模型评估在高精度数据集上的准确性。

本发明是通过以下技术方案实现的:

本发明涉及一种基于图神经网络的蛋白质结构模型质量评估方法,提取待预测类蛋白质诱饵里所有167种重原子在三维空间中的全局坐标作为输入,对其通过Rosetta软件的dual-space relax预处理后,解析计算得到原始节点特征和边特征并输入基于注意力机制和图池化技术构建的图神经网络模型,使用预训练好的模型网络参数进行计算,分别得到反映该类蛋白质诱饵结构在蛋白质水平和氨基酸残基水平上与真实天然蛋白结构的差距的全局得分和局部得分。

所述的167种重原子,即考虑自然界中能够构成蛋白质的20种标准氨基酸残基里所含有的所有相对原子质量较大的原子,相对其它原子而言其能够决定蛋白质在空间中的骨架姿态和相对位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210557804.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top