[发明专利]蛋白质三维结构的预测方法有效
申请号: | 200710098715.5 | 申请日: | 2007-04-25 |
公开(公告)号: | CN101294970A | 公开(公告)日: | 2008-10-29 |
发明(设计)人: | 唐鹤云;张正国;杨啸林;郭亚峰 | 申请(专利权)人: | 中国医学科学院基础医学研究所 |
主分类号: | G01N35/00 | 分类号: | G01N35/00;G06F19/00 |
代理公司: | 北京纪凯知识产权代理有限公司 | 代理人: | 程伟 |
地址: | 1000*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 三维 结构 预测 方法 | ||
技术领域
本发明属于蛋白质三维结构预测方法的从头预测(Ab Initio)领域, 尤其是一种基于多肽片段中央氨基酸装配的蛋白质结构预测方法。
背景技术
随着人类基因组计划的完成,我们进入了蛋白质组时代。蛋白质 组计划的主要任务是了解每个蛋白质,这包括每个蛋白质的序列、结 构和功能。对于任何一个蛋白质来讲,序列决定其结构,而正是这种 独特的结构赋予其独特的功能。所以说,获得蛋白质的三维结构对于 了解其功能具有重要意义。目前,可以通过一些实验方法(X线晶体 衍射、核磁共振等)来获取一个蛋白质的空间结构。但是,这些实验 方法都有着各自的局限性,而且进度远远低于蛋白质序列的测定。所 以,科学界发展了一些通过蛋白质序列来预测其结构的方法。当前预 测蛋白质结构的方法主要可以分为三大类,即同源建模、折叠识别、 从头预测。
目前,在众多的蛋白质结构预测方法中,同源建模是最成功的一 种。它是基于蛋白质在逐渐的进化过程中(氨基酸的替换、插入、或 删除)三维结构和功能高度保守。许多结构和功能相似的蛋白质之间, 通常它们的序列也非常相似。也就是说,高度的序列相似意味着高度 的结构相似性。同源建模试图通过目标蛋白和已知结构蛋白之间的序 列比较来确定目标蛋白的三维结构。同源建模的精度受目标蛋白和模 板之间序列相似性的制约。如果这两个蛋白间序列相似性不低于50%, 那么建模得到的结构和真实结构之间的RMSD(均方根差,用于衡量 两个结构之间的相似程度,数值越小表示相似程度越高)值通常会小 于1。当序列间的相似性在20%~30%之间时,95%的情况是结构不 一致,即使在结构数据库里能找到模板,模型骨架的RMSD也不会低 于2。
折叠识别也叫穿线法,它是基于不同的蛋白折叠数量是有限的这 样一个假设。这种方法是在一个唯一的或者是有代表性的结构库中搜 索相似的结构。它的过程和同源建模有点类似,都需要搜寻合适的模 板。不同的是折叠鉴定这一步骤。首先需要定义一个结构库。结构库 可以是包含整个蛋白、结构域、甚至保守的结构片段。用一个能量方 程(一般认为能量越低,结构越稳定)来衡量目标蛋白和库中每一个 结构的适合程度,从而找出最可能的模板。因为整个库中的每个折叠 都需要和目标蛋白进行比对,折叠识别方法需要大量的计算资源,这 使它的应用受到限制。另外一个主要的瓶颈是用来评估比对质量的能 量方程。因为计算效率的原因,这些方程作了大量的简化。用一个简 单的方程来找寻所有正确的折叠是不太可能的。然而,现在的能量方 程可以把大量可能的折叠减少到有限的几个。和同源建模类似,序列 相似性达到同一个蛋白家族水平,折叠识别产生的模型的RMSD值在 1到3之间;到超蛋白家族的水平时,RMSD值在3到6之间。
同源建模和折叠识别共同的限制是都需要合适的模板。当没有合 适的模板可以使用时,Ab Initio方法可以仅仅从序列信息预测蛋白结 构。这种方法通过反复模拟蛋白可能的构象变化并计算每种情况相应 的能量,找出一个能量最低方案。现在,Ab Initio方法可以预测RMSD 值在6以内的较大的蛋白。自CASP4(Critical Assignment of Structure Prediction,评测各种蛋白质结构预测方法)以来,ROSETTA从众多的 Ab Initio方法中脱颖而出,成为最成功的Ab Initio方法。它是基于不 同的蛋白质中氨基酸组成一致的局部小片段的结构有相似这样一个发 现。整个蛋白可以分割成一系列的小片段,而这些片段或者是与其相 似的结构都可以在已知结构的蛋白中找到。能量方程采用的结构—序 列贝叶斯概率公式。而对于非局部的相互作用,可以结合能量方程来 计算。但是,对于ROSETTA来讲,各片段之间的如何连接是一个重 大的问题。
所有的上述方法都存在一些共同的问题,就算运算量巨大,通常 需要大量的计算资源,普通PC无法运行;同时在大多数情况下,搜索 到的结构模板或片段与目标序列的氨基酸组成仅仅是相似,而不是完 全一致的,不同的氨基酸其侧链不同,那么在将结构模板上的氨基酸 替换为目标序列的氨基酸时,侧链安置是一个很难解决的问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院基础医学研究所,未经中国医学科学院基础医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710098715.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高碳钢线材中渗碳体的检验和评价方法
- 下一篇:一种网箱养殖黄姑鱼的方法