[发明专利]一种基于残基接触图的多目标优化蛋白质结构预测方法在审
申请号: | 202010704125.8 | 申请日: | 2020-07-21 |
公开(公告)号: | CN112085244A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 张贵军;陈芳;彭春祥;李亭;刘俊;周晓根 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16B15/00;G16B30/10;G06N3/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 残基 接触 多目标 优化 蛋白质 结构 预测 方法 | ||
一种基于残基接触图的多目标优化蛋白质结构预测方法,包括以下步骤:首先利用TripletRes、MetaPSICOV、RaptorX、STOP‑Contact预测目标蛋白质序列的残基接触图;其次,设计打分函数对种群初始化;然后,通过片段重组、组装对种群进行采样;最后,针对不同的预测服务器,根据设计的contact能量函数计算得到四个contact能量,通过调和平均数和标准差的加权打分函数Etotal(Cn)对种群中的所有构象进行排序,选出最后一代中的第一个构象作为预测结果。本发明能够缓解由于单一的残基接触图预测不精确导致蛋白质错误折叠,从而增加多样性,提高整体预测精度。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于残基接触图的多目标优化蛋白质结构预测方法。
背景技术
蛋白质是生命的基石,几乎所有的细胞活动都有蛋白质参与,蛋白质的三维结构决定其特殊的生物学功能。因此,蛋白质的结构信息在蛋白质研究中至关重要。例如,酶的催化功能是由蛋白质链的一部分完成,即暴露在蛋白质表面的活性位点来完成的。蛋白质间的相互作用以及蛋白质与核酸、抑制剂、活化剂的分子的相互作用也仅限于特定的蛋白质表面积。因此,只有在已知蛋白质结构的情况下,才有可能设计出与蛋白质表面相互作用的靶向药物。目前,蛋白质结构主要通过生物湿实验的方法来测定。然而,生物实验测定方法存在操作复杂,耗时长、成本高等缺点。因此,基于计算机技术,直接从蛋白质的一级或二级结构预测蛋白质的三级结构是结构生物信息学研究中一个主要问题。
蛋白质结构预测主要存在以下两方面的问题:(1)在高维和复杂的能量函数下的采样能力问题。(2)能量函数模型不精确的问题。目前,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然结构。针对能量函数不精确的问题,利用残基接触信息辅助能量函数有助于提升蛋白质结构预测精度,但是,目前预测残基接触信息不准确,容易影响整体的预测精度。
因此,对于现有的残基接触信息不准确导致蛋白质结构预测精度不足的问题,需要改进。
发明内容
为了缓解单一的残基对接触信息不准确导致蛋白质结构预测精度不足的问题,本发明提供一种基于残基接触图的多目标优化蛋白质结构预测方法,在基本遗传算法框架下,设计contact打分函数,根据四个contact预测服务器预测的残基接触图对构象进行打分、排序和选择,从而增加了种群多样性,改善了整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于残基接触图的多目标优化蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息,利用TripletRes服务器(zhanglab.ccmb.med.umich.edu/ResTriplet)、MetaPSICOV服务器(bioinf.cs.ucl.ac.uk/psipred)、RaptorX服务器(raptorx.uchicago.edu/ContactMap)、STOP-Contact服务器(sparks-lab.org/server/spot-contact)预测目标序列的残基接触图;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)根据残基接触图中残基对间的置信度,将残基对的置信度按照从大到小排列,并且选取前2L个接触信息,L为目标蛋白质的序列长度;
4)设置参数:种群规模NP,最大迭代次数G,温度因子β,ωT,ωP,ωR和ωS分别代表根据服务器TripletRes、MetaPSICOV、RaptorX和STOP-Contact预测的残基接触图计算出的contact能量所对应的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010704125.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分体式吊钩
- 下一篇:一种基于深度残差神经网络的蛋白质残基接触预测方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理