[发明专利]一种基于多轨迹和残基接触信息的蛋白质结构预测方法有效
申请号: | 201810986035.5 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109215734B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张贵军;王小奇;马来发;周晓根;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轨迹 残基 接触 信息 蛋白质 结构 预测 方法 | ||
一种基于多轨迹和残基接触信息的蛋白质结构预测方法,首先,对目标构象和随机选取的两个构象分别启动采用不同能量函数的Monte Carlo轨迹进行搜索;在所有的轨迹搜索结束后,采用统一的能量函数对组装后的三个构象进行打分;其次,分别计算出每个构象的特征向量与初始特征向量的距离误差;最后,按照一定的权重计算出能量与距离误差的总分,根据总分的大小选出潜在构象,并且用潜在构象替换目标构象。本发明提出一种预测精度高、计算代价低的基于多轨迹和残基接触信息的蛋白质结构预测方法。
技术领域
本发明涉及一种生物学信息学、人工智能优化、计算机应用领域,尤其涉及的是一种基于多轨迹和残基接触信息的蛋白质结构预测方法。
背景技术
蛋白质是一种由氨基酸以脱水缩合的形式组成肽链,再经过折叠形成具有一定空间结构的有机化合物,从而发挥特定的生物功能及活性机理。诺贝尔奖获得者ChristianB.发现氨基酸序列决定蛋白质的天然结构,接着又提出热力学假说,即稳定的天然蛋白质具有全局最低自由能。该假说为采用计算机技术预测蛋白质三维结构提供了理论基础。其中,从头预测蛋白质结构方法不需要已知的蛋白质结构模板,从氨基酸序列出发,通过在构象空间中不断地进行构象搜索,反复尝试各种可能的构象,最终找到目标序列的对应的蛋白质三维结构。该方法主要依靠两个关键因素:首先,拥有较为精确的能量函数,准确地找到具有全局最低自由能的稳定构象;其次,使用高效采样算法,使得构象采样过程中可以快速搜索到稳定的构象。
目前从头预测蛋白质结构的主要瓶颈主要集中于两点:第一,随着氨基酸序列的增加,构象空间急剧上升,现有的采样技术难以处理如此巨大的采样空间;第二,能量函数不够不精确,无法准确地描述构象的自由能,使得算法的准确性大大降低;第三,在采样过程中按照一定的机制从单一的初始状态向最低能量的状态逼近,很可能出现早熟现象。
因此,现有的构象空间优化方法在预测精度和采样效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测构象空间优化方法存在采样效率较低、预测精度较低的不足,本发明提出一种预测精度高、计算代价低的的基于多轨迹和残基接触信息的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于多轨迹和残基接触信息的蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)初始化参数:设置初始构象集的规模NP,最大迭代数Gmax,初始构象迭代次数iter,采样计数器CN,搜索轨迹最大次数CNmax,温度常数T,氨基酸序列中两个残基间的距离阈值num,其中num≥24且num∈R+,权重系数w1和w2;
3)残基间的远程作用:在氨基酸序列中,如果两个残基间的距离大于num,并且两个残基的Cα原子之间的距离小于则这对残基具有远程作用;
4)根据RaptorX-Contact预测的关联图选取目标蛋白中具有远程作用的所有残基对C={c1,c2,…ctotal},同时标记残基对cn的接触值dn,并构成初始特征向量D={d1,d2…,dtotal},其中total代表具有远程作用的残基对总数;
5)初始化构象集:启动NP条Monte Carlo轨迹,采用Rosetta的能量函数Score0对每个构象进行打分,每条轨迹搜索iter次,即生成NP个初始构象xi,i=1,...,NP构成初始构象集;
6)对每个目标构象xi,i=1,...,NP进行如下操作:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810986035.5/2.html,转载请声明来源钻瓜专利网。