[发明专利]一种基于深度学习的蛋白质模型质量评估方法在审

专利信息
申请号: 202210186433.5 申请日: 2022-02-28
公开(公告)号: CN114530195A 公开(公告)日: 2022-05-24
发明(设计)人: 张贵军;郭赛赛;刘俊;杨涛;冯琼琼;余众泽;周晓根 申请(专利权)人: 浙江工业大学
主分类号: G16B15/20 分类号: G16B15/20;G16B5/20;G16B30/00;G06N3/04;G06N3/08
代理公司: 浙江千克知识产权代理有限公司 33246 代理人: 赵芳
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 蛋白质 模型 质量 评估 方法
【说明书】:

一种基于深度学习的蛋白质模型质量评估方法,首先在PISCES服务器中筛选出设定蛋白质长度、最大序列冗余度和分辨率的蛋白质索引,然后从PDB库中下载相应蛋白质结构信息;使用RosettaCM比较建模、天然结构的随机位置插入片段进行扰动、trRosetta进行深度学习指导折叠三种方法生成每个蛋白在不同模型质量分布上的诱饵结构,构建数据集;对数据集中的每一个蛋白质天然结构及其诱饵结构提取一维、二维三维特征信息;再经过一系列三维卷积层生成的输出张量将被展平,并与其它一维特征串联后进行垂直和水平条带化,与其它二维特征结合在一起,得到141×L×L的特征图输入到二维卷积残差网络进行训练。本发明预测效率与准确性较高。

技术领域

本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于深度学习的蛋白质模型质量评估方法。

背景技术

蛋白质在几乎所有的生物过程中是普遍存在的。确定它们的结构和功能有助于理解并潜在地控制这些过程。然而,尽管蛋白质序列的测定现在是一个常规的程序,但利用这些信息来提取所研究系统的相关功能知识往往是非常困难的。事实上,蛋白质的功能依赖于其化学性质和机械性质的结合,这是由其结构决定的。因此,从其序列中鉴定蛋白质结构是非常重要的,尽管是一项艰巨的任务。实验结构识别并非在所有情况下都可行,并且通常非常繁琐且昂贵。因此,过去出现了试图从其序列预测蛋白质结构的计算方法。这些方法大多数都将蛋白质构象的采样步骤与模型质量评估步骤结合在一起,前者产生蛋白质构象,而后者对这些构象评分以选择与天然结构尽可能接近的蛋白质构象。

蛋白质模型质量评估是结构生物信息学中一个重要而又亟待解决的问题。目前,蛋白质模型的评分有三类。第一种是仅使用实际模型信息的单模型方法,如进化信息、残基环境兼容性、来自物理或基于知识的统计势,或不同结构特征的组合。第二类是共识方法,主要使用多个模型或模板比对的共识,对给定序列选择最可能的模型。最后,也有混合方法,结合单模型和共识方法。虽然共识方法擅长在预测与真实质量度量之间实现高度相关性,但在困难情况(缺乏共识)或模型非常相似的简单情况下,共识方法常常无法选择最佳的可能模型。而单模型方法不需要模型集合,即使没有共识也可以挑选出好的模型,也只有单模型方法才可以用于构象采样并作为细化指导,以进一步提高性能。

目前用于单模型质量评估的最佳方法通常结合了的不同方法,每种方法基于不同输入特征。然后,使用机器学习算法对预测模型进行训练。最近,随着卷积神经网络的发展,深度学习大量运用在生物信息领域,这促使我们将三维卷积网络应用到蛋白质模型的模型质量评估的问题上。

综上所述,已有的蛋白质模型质量评估方法在评估蛋白质模型质量的准确性和计算效率上还不够完善,从而导致无法可靠地得到蛋白质模型质量,进而指导蛋白质细化,故而需要做出改进。

发明内容

针对以上技术问题,为了克服现有技术的不足,本发明提出了一种基于深度学习的蛋白质模型质量评估方法,不仅提高了蛋白质模型质量评估的准确性,而且提高了计算效率。

本发明解决其技术问题所采用的技术方案是:

一种基于深度学习的蛋白质模型质量评估方法,所述方法包括以下步骤:

1)在PISCES服务器中筛选出设定蛋白质长度、最大序列冗余度和分辨率的蛋白质索引,然后从PDB库中下载相应蛋白质结构信息,得到包含M个蛋白质结构信息;

2)使用三种方法生成步骤1)中每个蛋白在不同模型质量分布上的n个诱饵结构;首先使用RosettaCM对每个天然结构进行不同精度模板的比较建模,每个天然结构得到n1个诱饵结构;然后使用RosettaCM在每个天然结构的随机位置插入片段进行扰动,得到每个天然结构得到n2个诱饵结构;最后使用trRosetta进行深度学习指导折叠,得到每个天然结构得到n3个诱饵结构,n=n1+n2+n3;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210186433.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top