[发明专利]一种基于多残基接触图协同约束的蛋白质结构预测方法有效
申请号: | 202010578257.0 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111815036B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 张贵军;彭春祥;刘俊;周晓根;夏瑜豪;赵凯龙 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16B20/20;G16B30/10;G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 残基 接触 协同 约束 蛋白质 结构 预测 方法 | ||
一种基于多残基接触图协同约束的蛋白质结构预测方法,基于Rosetta的框架,首先利用Rosetta第一、第二阶段对种群初始化,然后通过对目标构象进行变异、交叉生成新的测试构象;其次,根据四个contact服务器预测得到的残基接触图,设计基于残基接触图的余弦相似度指标来辅助Rosetta能量函数score3对构象进行更新,从而引导算法采样得到能量更低且结构更紧凑的构象。本发明提供一种预测精度较高的基于多残基接触图协同约束的蛋白质结构预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于多残基接触图协同约束的蛋白质结构预测方法。
背景技术
蛋白质结构预测是结构生物信息学的主要研究内容,也是分子生物学中心法则尚未解决的一个重大基础性科学研究课题。2018年12月初,在墨西哥坎昆举行的全球蛋白质结构预测竞赛(CASP13)中,谷歌旗下DeepMind团队研发的AlphaFold获得总分第一名。AlphaFold使得蛋白质结构预测这一前沿性基础研究问题从科学的殿堂进入民众的视野,成为目前的一个“热议”方向,注定其会成为结构生物信息学发展历程中的一个重要里程碑;该工作同时也表明了计算机技术、信息技术与生命科学领域的深度交叉融合,将会有效地驱动和加速科学新发现。
蛋白质结构预测的重要性源于目前实验测定方法存在的局限性。X射线晶体衍射是目前测定蛋白质结构最有效的方法,所能达到的精度是其它方法所不能比拟的,主要缺点是蛋白质晶体难以培养且晶体结构测定的周期较长;多维核磁共振(NMR)方法可以直接测定蛋白质在溶液中的构象,但是对样品的需要量大、纯度要求高,目前只能测定小分子蛋白质。对于药物靶标—膜蛋白而言,现有实验测定技术极难获得其三维结构;
蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。因此,了解蛋白质的三维结构(天然态结构)是了解蛋白质的生物功能的关键。蛋白质三维结构可以通过核磁共振和X光晶体衍射等实验方法得到,然而这些实验测定方法不仅耗时而且极其昂贵,对于某些不易结晶的蛋白质来说不适用。因此,根据的Anfinsen的热力学假说(具有最低能量的构象被认为是天然态结构),很多计算算法被提出用于蛋白质结构预测。
在理论探索和应用需求的双重推动下,根据Anfinsen法则,利用计算机预测蛋白质结构技术在20世纪末得到了蓬勃发展。1994年美国马里兰大学的科学家Moult发起的CASP竞赛是一个世界性的蛋白质结构预测评比活动,客观地反映了当前蛋白质结构预测领域发展的最新技术水平,被誉为蛋白质结构预测的奥林匹克竞赛。该比赛旨在吸引计算机科学、生物物理学等不同领域的专家参与到蛋白质三维结构预测这一极具挑战性的生物信息学问题中来,共同评估发展现状和讨论未来的趋势。
通过计算技术进行蛋白结构预测通常用一个很复杂的能量函数来评估,其能量函数曲面通常具有成千上万的自由度和大量的局部最优解,构象搜索空间极大。为了进行构象空间搜索,从头预测方法通常首先根据基于知识的粗粒度能量模型获得构象空间的全局最小解,然后对其对应的构象进行精修,从而得到预测结构。因此,从头预测方法需要解决两个问题:1.建立合适的能量函数来评价构象的合理性;2.提出有效的构象空间搜索方法来搜索全局最优解。第一个因素本质上属于分子力学问题,主要是为了能够计算得到每个蛋白质结构对应的能量值。第二个因素本质上属于全局优化问题,通过选择一种合适的优化方法,对构象空间进行快速搜索,得到与某一全局最小能量对应的构象。
差分进化算法(DE)由于其结构简单,易于实现,鲁棒性强和收敛速度快等优点已被成功应用于蛋白结构预测。然而,随着氨基酸序列的增长,蛋白质分子体系自由度也增大,利用传统群体算法采样获得大规模蛋白质构象空间的全局最优解成为一项挑战性的工作;其次,粗粒度模型虽然减小了构象搜索空间,但是也导致了相互作用力之间的信息丢失,从而直接影响预测精度。
因此,现有的蛋白质结构预测方法采样效率和预测精度方面存在不足,需要改进。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010578257.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理