[发明专利]一种统计计算固有无序蛋白多态结构的方法有效
申请号: | 201610850424.6 | 申请日: | 2016-09-26 |
公开(公告)号: | CN106548040B | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 何建锋 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
地址: | 100081 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种统计计算固有无序蛋白多态结构的方法,属于蛋白质非平衡动力学与多态结构研究领域。通过对固有无序蛋白进行上千次的折叠或非平衡动力学模拟,统计分析获得固有无序蛋白的结构图景、聚类和特性为主的重要信息,步骤为:1获取蛋白质实验结构;2计算中心碳原子链接形成的键角和扭转角;3构建蛋白质拟合模型;4模拟细胞环境变化导致固有无序蛋白的构型变化过程;5对蛋白质进行千次以上加热‑冷却模拟循环,确定具有多态结构的低温值和高温值;6获得提纯的末态构型数据组;7归纳和分析固有无序蛋白的结构聚类;8可视化固有无序蛋白结构聚类的特征构型。本发明解决了传统理论及实验方法难以同时捕捉固有无序蛋白多态结构的难题。 | ||
搜索关键词: | 一种 统计 计算 固有 无序 蛋白 结构 方法 | ||
【主权项】:
1.一种统计计算固有无序蛋白多态结构的方法,其特征在于:通过对固有无序蛋白进行上千次的折叠或非平衡动力学模拟,统计分析获得固有无序蛋白的结构图景、聚类和特性为主的重要信息;为实现上述目的,一种统计计算固有无序蛋白多态结构的方法,步骤如下:步骤(1):获取蛋白质实验结构;其中,蛋白质实验结构过程可以从蛋白质数据银行PDB获取,且获取固有无序蛋白;蛋白质实验结构是X‑Ray晶体衍射或NMR解析的结构两种中的一种;步骤(2):采用步骤(1)的蛋白质实验结构中心碳原子坐标数据,计算中心碳原子链接形成的键角和扭转角;其中步骤(2)中,中心碳原子记为Cα,中心碳原子的坐标记为(x,y,z),键角与扭转角,记为(κ0i,τ0i);i代表从氮末端开始的第i个氨基酸;步骤(3):构建蛋白质拟合模型;其中,蛋白质等同于步骤(2)中的中心碳原子链;步骤(3),具体为:步骤(3).1根据步骤(2)输出将中心碳原子链分为多个片段,并对每个片段搜索能量函数的极小值,得到每个片段的拟合键角与扭转角及相应能量函数的参数值;步骤(3).2将步骤(3).1中的每个片段顺次拼接在一起,再次搜索能量函数的全局极小,获得若干拟合结构及最优结构;步骤(3).1和步骤(3).2中的能量函数表述为如下公式(1):
其中,κi为拟合键角,τi为扭转角;对上述公式(1)取极小值得到的拟合键角记为κi,扭转角记为τi,能量函数参数值,记为(c,m,b,d,e,q);i与步骤(2)中氨基酸的序号一致;N代表氨基酸的总数;其中,步骤(3).2中确定了参数值的能量函数描述蛋白质的自由能,得到的拟合键角与扭转角描述构建的能量极小构象,简记为拟合结构;最优结构通过将此组新的拟合键角与扭转角构建的拟合结构与步骤(1)的蛋白质实验结构之间的中心碳原子Cα的均方根偏差(RMSD)比较得到;步骤(4):模拟细胞环境变化导致固有无序蛋白的构型变化过程;步骤(4)中,模拟固有无序蛋白的构型变化过程可采用模拟退火算法,具体为:细胞环境变化导致固有无序蛋白的构型变化过程是一个非平衡动力学过程,由步骤(3).2输出的拟合结构中的拟合键角与扭转角作为蛋白质的初始状态解,能量函数,即公式(1),用来计算每一Monte Carlo步的蛋白质能量,对应此Monte Carlo步的新解的接受准则采用Metroplis准则;Monte Carlo步数根据蛋白质的长度进行合理设置,模拟退火算法中的低温和高温值由实际模拟情况设定;固有无序蛋白从部分结构化到完全无结构化对应着由低温到高温的加热过程,从完全无结构化到部分结构化对应着由高温到低温的冷却过程;低温,记为T1;高温,记为T2;步骤(5):基于步骤(3)的拟合结构,重复步骤(4)对蛋白质进行千次以上的加热‑冷却模拟,称为加热‑冷却模拟循环,确定具有多态结构的低温值和高温值;其中,加热‑冷却模拟指的是模拟蛋白质从部分结构化到完全无结构化后回到部分结构化的非平衡动力学过程,步骤(5)中的每一次加热‑冷却模拟循环过程为:步骤(5).1将蛋白质的拟合结构在低温做N0步热平衡;步骤(5).2用N1步将蛋白质体系线性地从低温加热到高温;步骤(5).3在高温处对蛋白质进行N2步的平衡热浴,确保蛋白质充分地打开和热平衡;步骤(5).4接下来的N3步将蛋白质体系线性地从高温冷却回低温;步骤(5).5最后,在低温做同样的N0步热平衡,使蛋白质冷却充分;在步骤(5)确定具有多态结构的低温值和高温值,具体为:计算加热‑冷却模拟循环中的中心碳原子Cα原子RMSD、回旋半径Rg和体系能量E,观察RMSD和Rg相对于平均值的波动,以低温时RMSD和Rg偏差小于0.1埃为标准确定低温的T1值;一次加热‑冷却模拟循环后,初末态构象之间的Cα原子RMSD小于1.0埃,认为蛋白质重新折叠回去;选择不同高温值进行反复测试,统计所有加热‑冷却循环后蛋白质折叠回去所占的百分比,比率约为50%的高温值为选定的T2值;步骤(6):提纯步骤(5)加热‑冷却模拟循环后的蛋白质结构,获得提纯的末态构型数据组;步骤(6)经过步骤(5)千次以上加热‑冷却模拟循环后,通过体积排斥法提纯加热‑冷却循环后的蛋白质结构,即末态构型数据组,具体为:将步骤(5)所有加热‑冷却模拟循环后的蛋白质末态构型输出,以pdb文件的标准格式存储,一个文件存放一个末态构型;采用侧链安装工具PULCHRA软件或SCWRL4软件中的一种,给所有末态构型安装侧链,得到全原子构型;计算蛋白质分子中任意一对非成键原子的间距,任意原子对间距都大于等于设定值时,视该构型为合理构型而保留;如果存在原子对间距小于设定值,则去掉该构型;其中,设定值范围在1.2‑1.8埃;步骤(7):由步骤(6)提纯的末态构型数据组,归纳和分析固有无序蛋白的结构聚类,具体为:从末态构型数据组中读取Cα原子坐标,计算RMSD、Rg、末端距Dee和体系能量E;体系能量E由步骤(3)拟合的能量函数,将末态构型的键角与扭转角值直接代入计算;Dee是蛋白质氮末端与碳末端的Cα原子距离;获得所有末态构型的RMSD、Rg、末端距Dee和体系能量E后,画柱状分布图或者Rg‑Dee、RMSD‑Rg、Rg‑E二维图或者RMSD‑Rg‑E、Dee‑Rg‑E三维图,由这些图展现固有无序蛋白的结构分布的局域性,揭示其结构聚类;步骤(8):可视化固有无序蛋白结构聚类的特征构型,利用步骤(8)末态构型RMSD、Rg、Dee、E后分布图,找到末态构型的分布区域;其特点是,在分布图中,末态构型的对应点聚集在M个狭小的区间,每个聚集区之间有一定的间隔且分布点相对较多;在每个聚集区随机挑选K个点,找到其对应的结构;用VMD和Jmol为主的蛋白质可视化软件,显示出这些构型的三维结构并进行结构特性分析;其中,M值为大于1的整数;K值大于等于1的整数;至此,从步骤(1)到步骤(8),完成了一种统计计算固有无序蛋白多态结构的方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610850424.6/,转载请声明来源钻瓜专利网。