[发明专利]一种基于域间残基接触的多域蛋白结构组装方法有效
申请号: | 201910316906.7 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110164506B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 周晓根;张贵军;彭春祥;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B35/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 残基 接触 蛋白 结构 组装 方法 | ||
一种基于域间残基接触的多域蛋白结构组装方法,从各结构域的三维结构出发,利用结构比对工具对蛋白质库中所有的多域蛋白模板进行打分,并选择得分最高的模板进行组装;然后根据模板生成初始结构,并随机选择一个较小的区域进行刚体旋转和平移,从而生成新的全长结构;其次,根据域间残基接触、模板和域间原子冲突能量来评价组装结构的质量,并根据蒙特卡洛准则接受组装结构;最后,选择所有模板组装得到的结构中能量最低的结构为最终结构。本发明提供一种预测精度较高的基于域间残基接触的多域蛋白结构组装方法。
技术领域
本发明涉及一种智能优化、生物信息、计算机应用领域,尤其涉及的是一种基于域间残基接触的多域蛋白结构组装方法。
背景技术
大规模蛋白通常由多个独立折叠的域蛋白组成。尽管每个域蛋白可以独立完成生物功能,但是多个结构域组合起来可以完成独立的域蛋白不能完成的生物功能。此外,许多生物功能依赖于域和域之间的相互作用,例如,很多酶就是不同结构域的接触面之间实现其功能的。统计显示,自然界中,至少有90%的真核蛋白和67%的原核蛋白包含多个结构域。
在目前的蛋白质库中,大部分多域蛋白都被看作单域蛋白。目前,蛋白质库中有60多万个蛋白质,仅有34.7%的蛋白为多域蛋白。此外,几乎所有的蛋白质结构预测方法都是针对单域蛋白的结构预测设计的,包括能量函数和采样方法等。因此,导致蛋白质库中,多域蛋白和单域蛋白之间的鸿沟越来越大。
为了减小多域蛋白和单域蛋白之间的鸿沟,从序列出发,将整个蛋白质序列划分为多个结构域,然后利用单域蛋白结构预测方法预测每个单域的结构,最后将各单域结构组装到一起得到对应的全长结构,是目前预测多域蛋白结构的有效方法之一。多域蛋白的结构组装方法有两类。第一类是刚体组装。第二类通linker采样。其中,第一类方法可以看作为蛋白之间的对接问题,一些对接方法也可以用作多域蛋白结构的组装;与第一类方法不同,第二类方法可以看作域蛋白之间相对较短的氨基酸序列的结构从头预测问题,由于只改变连接域蛋白之间的构象的结构,其采样空间很小。然而,由于上述方法没有有效的能量引导,从而在组装中无法准确确定域蛋白的组装方向,进而导致预测精度较低。
因此,现有的多域蛋白结构组装方法在预测精度方面存在着缺陷,需要改进。
发明内容
为了克服现有多域蛋白质组装方法的精度较低的不足,本发明提出一种精度较高的基于域间残基接触的多域蛋白结构组装方法。
本发明解决其技术问题所采用的技术方案是:
一种基于域间残基接触的多域蛋白结构组装方法,所述方法包括以下步骤:
1)给定待组装蛋白各结构域的三维结构以及全长序列信息;
2)参数设置:设置最大迭代次数Imax,冲突距离阈值dclash,组装模板数量T,温度长度K,接触能量深度dwell;
3)利用结构比对工具TM-align(https://zhanglab.ccmb.med.umich.edu/TM-align/)对蛋白质PDB库(http://www.rcsb.org/)中的每一个多域蛋白进行打分,每个模板的得分为每个结构域与模板之间TM-score(https://zhanglab.ccmb.med.umich.edu/TM-score/)的平均值,并选择得分最高的T个模板;
4)利用残基接触预测工具NeBcon(https://zhanglab.ccmb.med.umich.edu/NeBcon/)预测得到全长序列的残基接触图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910316906.7/2.html,转载请声明来源钻瓜专利网。