[发明专利]一种残基接触辅助策略自适应的蛋白质结构预测方法有效
申请号: | 201910302620.3 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110148437B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 彭春祥;张贵军;刘俊;赵凯龙;周晓根 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G06N3/12 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 残基 接触 辅助 策略 自适应 蛋白质 结构 预测 方法 | ||
一种残基接触辅助策略自适应的蛋白质结构预测方法,在进化算法框架下,首先,建立四种不同的自适应变异策略,算法前期四种变异策略都等概率被选择,当算法经历一段学习周期LP后,算法采取自适应的变异策略对构象进行变异,并且对生成的变异构象进行一次片段组装,生成变异构象;其次对变异构象进行交叉操作;最后用残基接触能量CI辅助Rosetta能量函数score3对构象进行选择;迭代上述过程直至满足条件后输出结果。本发明提供一种采样效率高、预测精度高的残基接触辅助策略自适应的蛋白质结构预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种残基接触辅助策略自适应的蛋白质结构预测方法。
背景技术
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。因此,要了解蛋白质的功能,就必须获得其三维空间结构。
测定蛋白质三维结构的实验方法主要包括X射线晶体衍射和多维核磁共振(NMR)。X射线晶体衍射是目前测定蛋白质结构最有效的方法,所达到的精度是其它方法所不能比拟的,主要缺点是蛋白质晶体难以培养且晶体结构测定的周期较长;NMR方法可以直接测定蛋白质在溶液中的构象,但是对样品的需要量大、纯度要求高,目前只能测定小分子蛋白质。实验测定结构方法存在的主要问题在于两个方面:一方面,对于现代药物设计的主要靶标—膜蛋白而言,极难获得其结构;另外,实验测定过程费时费钱费力,代价不菲,比如,使用NMR方法测定一个蛋白质结构通常需要15万美元以及半年的时间。所以蛋白质三级结构预测是生物信息学的一个重要任务。
目前,蛋白质结构预测方法大致可以分为两类,基于模板的方法和从头预测方法。其中,从头预测方法直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化(或称采样)方法是目前制约蛋白质结构从头预测精度最关键的因素之一。优化算法应用于从头预测采样过程必须首先解决以下三个方面的问题:(1)能量模型的复杂性。蛋白质能量模型考虑分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,局部极小解数量随着序列长度的增加呈指数增长;能量模型的漏斗特性也必然会产生局部高能量障碍,导致算法极易陷入局部解。(2)能量模型高维特性。就目前而言,从头预测方法只能应对尺寸较小(150残基)的目标蛋白,一般不超过100。对尺寸超过150残基以上的目标蛋白,现有优化方法均无能为力。这也就进一步说明了随着尺寸规模的增加,必然造成维数灾问题,完成如此浩瀚的构象搜索过程所涉及的计算量是目前最先进的计算机也难以承受的。(3)能量模型的不精确性。对于蛋白质这类复杂的生物大分子,除了考虑各种物理成键和知识推理的作用之外,还要考虑它与周围溶剂分子的相互作用,目前还无法给出精确的物理描述。考虑到计算代价问题,近十年来研究者陆续提出了一些列基于物理的力场简化模型(AMBER,CHARMM等)、基于知识的力场简化模型(Rosetta,QUARK等)。然而,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然态结构;此外,模型的不精确性也必然会导致无法对算法性能进行客观地分析,从而阻碍了高性能算法在蛋白质结构从头预测领域中的应用。
随着氨基酸序列的增长,蛋白质分子体系自由度也增大,利用传统群体算法采样获得大规模蛋白质构象空间的全局最优解成为一项挑战性的工作;其次,粗粒度模型虽然减小了构象搜索空间,但是也导致了相互作用力之间的信息丢失,从而直接影响预测精度。
因此,现有的蛋白质结构预测方法采样效率和预测精度方面存在不足,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法对蛋白质构象空间采样效率低、预测精度较低的不足,本发明在基本差分进化算法框架下,引入自适应变异策略来指导构象空间搜索,同时结合残基接触信息作为辅助评价指标选择构象,提出一种采样效率高、预测精度高的残基接触辅助策略自适应的蛋白质结构预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910302620.3/2.html,转载请声明来源钻瓜专利网。