[发明专利]一种基于多轨迹和残基接触信息的蛋白质结构预测方法有效
申请号: | 201810986035.5 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109215734B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张贵军;王小奇;马来发;周晓根;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于多轨迹和残基接触信息的蛋白质结构预测方法,首先,对目标构象和随机选取的两个构象分别启动采用不同能量函数的Monte Carlo轨迹进行搜索;在所有的轨迹搜索结束后,采用统一的能量函数对组装后的三个构象进行打分;其次,分别计算出每个构象的特征向量与初始特征向量的距离误差;最后,按照一定的权重计算出能量与距离误差的总分,根据总分的大小选出潜在构象,并且用潜在构象替换目标构象。本发明提出一种预测精度高、计算代价低的基于多轨迹和残基接触信息的蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 轨迹 残基 接触 信息 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于多轨迹和残基接触信息的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)给定输入序列信息;2)初始化参数:设置初始构象集的规模NP,最大迭代数Gmax,初始构象迭代次数iter,采样计数器CN,搜索轨迹最大次数CNmax,温度常数T,氨基酸序列中两个残基间的距离阈值num,其中num≥24且num∈R+,权重系数w1和w2;3)残基间的远程作用:在氨基酸序列中,如果两个残基间的距离大于num,并且两个残基的Cα原子之间的距离小于则这对残基具有远程作用;4)根据RaptorX‑Contact预测的关联图选取目标蛋白中具有远程作用的所有残基对C={c1,c2,…ctotal},同时标记残基对cn的接触值dn,并构成初始特征向量D={d1,d2…,dtotal},其中total代表具有远程作用的残基对总数;5)初始化构象集:启动NP条Monte Carlo轨迹,采用Rosetta的能量函数Score0对每个构象进行打分,每条轨迹搜索iter次,即生成NP个初始构象xi,i=1,...,NP构成初始构象集;6)对每个目标构象xi,i=1,...,NP进行如下操作:6.1)每次迭代中随机选取两个个构象xj,j∈{1,2,...,NP且j≠i}和xk,k∈{1,2,...,NP且k≠j≠i}:6.2)轨迹1中设定构象xi为操作构象,打分函数采用Rosetta的能量函数Score1;6.3)对目标构象进行片段组装,计数器CN开始计数,利用能量函数计算组装前后的能量值E和E′,根据公式ΔE=E′‑E计算出组装前后的能量变化值;6.4)是否接收该片段的插入主要根据公式P(ΔE)=min{1,e‑ΔE/T}>rand判断,其中rand∈[0,1]的随机数;判断CN≤CNmax是否满足,如果满足则依次执行步骤6.3)和6.4);如果不满足则计数器CN清零,停止片段组装;6.5)输出搜索后的构象x′i;6.6)轨迹2中选择构象xj为操作构象,打分函数采用Rosetta能量函数Score2;6.7)对构象xj依次执行6.3)和6.4);6.8)输出搜索后的构象x′j;6.9)轨迹3中选择构象xk为操作构象,打分函数采用Rosetta的能量函数Score5;6.10)对构象xk依次执行6.3)和6.4);6.11)输出搜索后的构象x′k;6.12)根据构象x′i,x′j,x′k的能量和距离误差选出潜在构象,过程如下:6.12.1)依次判断构象x′i的氨基酸对cn之间是否存在相互作用,如果存在相互作用,则残基的接触值d′n=1,否则残基间的接触值d′n=0,并构成特征向量D′={d′1,d′2,…,d′num};6.12.2)计算构象x′i的特征向量D′={d′1,d′2,…,d′n}与初始特征向量D={d1,d2…,dnum}的距离误差6.12.3)与步骤6.12.1)和6.12.2)同理计算出构象x′j相应的距离误差sim2;6.12.4)与步骤6.12.1)和6.12.2)同理计算出构象x′k相应的距离误差sim3;6.12.5)根据Rosetta的能量函数Score3分别计算得到构象x′i,x′j,x′k的能量值分别为en1,en2,en3;6.12.6)根据公式E1=w1·sim1+w2·en1计算构象x′i的总得分;6.12.7)根据公式E2=w1·sim2+w2·en2计算构象x′j的总得分;6.12.8)根据公式E3=w1·sim3+w2·en3计算构象x′k的总得分;6.12.9)比较E1,E2,E3的大小,选出优势构象,即总得分最小的构象为潜在构象;6.13)用潜在构象替换目标构象,即更新初始构象集;7)判断是否达到最大迭代数Gmax,若达到最大迭代数,则结束迭代,否则转至步骤6)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810986035.5/,转载请声明来源钻瓜专利网。