[发明专利]一种小蛋白骨架设计方法及其应用有效
申请号: | 202011382858.0 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112382336B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 王天元;吴炜坤;赖力鹏;温书豪;马健 | 申请(专利权)人: | 北京晶泰科技有限公司 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B30/10;G16B30/20;G16B40/00;G16B50/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡吉科 |
地址: | 100083 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白 骨架 设计 方法 及其 应用 | ||
本发明提供一种小蛋白骨架的设计方法及其应用,包括以下步骤,S1:创建专用的结构片段数据库;S2:生成小蛋白骨架数据库;S3:对小蛋白骨架进行氨基酸序列优化和设计;S4:采用与稳定性相关的指标对结构进行评价和过滤,不满足标准的结构将被移除过滤,最终形成计算预测上能够稳定折叠的小蛋白。本方法与现有方法最大的不同在于,文献报道设计的拓扑结构为HLHLHLHLH,而本发明设计的是更小的拓扑结构为HLHLH的蛋白,并且本发明根据HLHLH拓扑结构的专门定义了更加严格的过滤标准,改进了SEWING的采样方法,因此设计出来的蛋白稳定性和序列可设计性应当更高,并且计算过程中优质骨架生成的效率更高。
技术领域
本发明属于生物技术领域,具体涉及一种小蛋白骨架计算设计方法及其应用。
背景技术
目前,使用晶体结构的蛋白质片段或晶体结构的二级结构单元进行随机组装,生成有特定折叠模式的蛋白质结构以及序列。现有的骨架生成方法效率较低,得到的蛋白质结构模型质量参差不齐,需要大量的人工检查和参数评定,对数据库进行过滤,费时费力,人为视觉检查标准无法统一。并且在设计靶向结合的小蛋白时,经常匹配不到合适的小蛋白骨架模板,因此增加可用的小蛋白骨架数据是必要的。
发明内容
因此,本发明提供一种改进的小蛋白骨架设计方法,可以组装生成大量能够稳定折叠的蛋白作为靶向结合小蛋白的结构模板,该设计方法可克服当前的模板数量不足的问题,并使用提出的新的过滤标准实现自动化过滤,得到较高质量、稳定性数据较好的蛋白质骨架模型。
具体技术方案为:
一种小蛋白骨架的设计方法,包括以下步骤:
步骤(1),创建新的蛋白质数据库,从PDB数据库中将解析精度在以下,小于30%序列相似的非冗余数据提取作为数据的输入集,将每段螺旋长度为5-25个氨基酸长度的HLH片段进行分离,制备成新的数据库,以此将螺旋结构的大小控制在30-90个氨基酸区间。
步骤(2),生成小蛋白骨架数据库,采用改进的SEWING方法,通过图路径与蒙特卡洛的搜索方法,不断地将步骤(1)新建的蛋白质数据库中的HLH片段进行随机组装,得到大量的粗粒化骨架模型,并使用新制定的结构特征指标对骨架模型进行初次过滤,形成小蛋白骨架数据库;
所述的改进的SEWING方法具体为:通过图路径与蒙特卡洛的搜索方法,将每个HLH片段作为图路径搜索中的一个节点,将能够与该HLH结构吻合匹配的片段作为邻近的节点,然后随机地从一个节点进行出发,随机地选择相邻的节点进行结构组装。在迭代50,000-100,000步蒙特卡洛模拟退火搜索的过程中,每步迁移到一个节点时,以0.05%-0.5%、80.0%-94.5%的概率进行删除或替换上一步成功添加的HLH片段结构,或以5%-20%的概率将当前节点的HLH片段结构到已有的结构当中去。以上每步迭代搜索进行删除、替换或新增的操作生成的新结构构象,需要使用SEWING自带的简化能量打分模型进行能量评估,使用metropolis标准判定是否接纳此新的结构状态。此外,如果新添加或替换的片段与其他的区域存在骨架冲撞,那么这个构象将被抛弃。
所述结构特征指标包括:第一,通过统计每段螺旋上氨基酸Cα原子与其他螺旋上每一个氨基酸的Cα原子之间的距离,当这个距离时,骨架的可设计性较低,大概率会引入丙氨酸,过多的丙氨酸不利于蛋白质的折叠,因此该改进操作可提高骨架氨基酸的可设计性;第二,在生成过程中,要求位于N段和C段的螺旋结构长度不得低于7个氨基酸,该改进有助于形成更加稳定的二级结构螺旋;第三,通过统计每段螺旋结构的几何中心与蛋白结构的质量中心结构的距离,该距离该标准的设定有助于筛选出那些螺旋结构之间存在紧密堆积的模型。
步骤(3),对小蛋白骨架进行氨基酸序列优化和设计,使用Rosetta FastDesignMover对小蛋白骨架数据库中的小蛋白的氨基酸序列和侧链原子进行设计和能量优化,然后多次设计迭代形成新的蛋白序列结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶泰科技有限公司,未经北京晶泰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011382858.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:快拆式RF测试机构
- 下一篇:一种具有误差修正功能的蒙汉神经机器翻译方法