[发明专利]一种基于多样性指标的群体蛋白质构象空间优化方法有效
申请号: | 201810438596.1 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108595910B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 张贵军;彭春祥;刘俊;周晓根;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00;G06N3/00;G06N3/12 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多样性 指标 群体 蛋白质 构象 空间 优化 方法 | ||
一种基于多样性指标的群体蛋白质构象空间优化方法,首先,利用Rosetta第一阶段进行片段组装生成初始种群,并利用Rosetta第二阶段进行片段组装生成新种群;然后,针对随机选取的Loop区域,对构象进行Loop交换,从而实现种群重组;其次,基于Loop区域,对每个构象进行变异操作,并将变异生成的所有新个体与当前种群进行合并,并提取构象的USR特性信息建立多样性指标,基于该指标和能量对整个种群进行更新操作;最后,分别利用Rosetta第三和第四阶段对整个种群进行进一步优化,从而得到最终预测结果。本发明采样效率较高、多样性较好、复杂度较低及预测精度较高。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于多样性指标的群体蛋白质构象空间优化方法。
背景技术
生物信息学是生命科学和计算机科学交叉领域的一个研究热点。生物信息学研究成果目前已经被广泛应用于基因发现和预测、基因数据的存储管理、数据检索与挖掘、基因表达数据分析、蛋白质结构预测、基因和蛋白质同源关系预测、序列分析与比对等。基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基酸序列。蛋白质决定了细胞的功能,使细胞的活动与生命相关联。而蛋白质的三维结构是其独特功能特性的主要决定因素之一。因此,蛋白质结构的确定是理解这些重要的生命基石的功能的基本步骤。虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠形成特定的空间结构才能具有相应的活性和相应的生物学功能。了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行功能的。确定蛋白质的结构的是非常重要的。深入了解蛋白质的结构功能可以帮助设计具有特定功能的蛋白质,药物和疫苗的研发以及蛋白质错误折叠的病理特征(例如阿尔茨海默病)。目前,蛋白质序列数据库的数据积累的速度非常快,但是,已知结构的蛋白质相对比较少。尽管蛋白质结构测定技术有了较为显著的进展,但是,通过实验方法确定蛋白质结构的过程仍然非常复杂,代价较高。因此,计算方法已经成为蛋白质结构预测的基础。预测一个蛋白质分子的三维结构,只用它的氨基酸序列,但是在计算生物学中仍然是一个巨大的挑战。人们希望能够通过生物信息技术去精确的预测蛋白质结构。
与许多蛋白质结构预测方法一样,使用一种简化的三维结构表示蛋白质模型,它只包含关于主扭转角的信息。蛋白质结构预测使用片段组装方法,并通过基于物理的能量模型或者基于知识的能量模型指导搜索,而这种方法存在着能量函数的不精确、采样效率低、多样性差、复杂度较高、预测精度较低的不足,目前,最常用的片段组装的方法仍然依赖于数千次蒙特卡罗重启,而不是基于进化信息的的搜索技术。从某种意义上说,盲目的随机蒙特卡罗重启所得到的结果具有不确定性。
因此,现有的蛋白质结构预测方法在采样效率、种群多样性、计算复杂度及预测精度方面存在缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法采样效率低、构象多样性差、复杂度较高、预测精度较低的不足,本发明通过提取蛋白质的特征信息衡量构象的多样性,提出一种采样效率较高、多样性较好、复杂度较低及预测精度较高的基于多样性指标的群体蛋白质构象空间优化方法。
本发明解决其技术问题所采用的技术方案是:
一种基于多样性指标的群体蛋白质构象空间优化方法,所述优化方法包括以下步骤:
1)给定输入序列信息;
2)设置参数:种群大小NP,重组因子RC,最大迭代代数Gmax,多样性接收概率p;
3)利用PSIPRED预测查询序列的二级结构信息;
4)初始化:首先通过用Rosetta第一阶段进行片段组装生成一个规模为NP的初始种群P={xi|i∈I},其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP},xi表示第i个个体;
5)采用Rosetta第二阶段的局部搜索策略对每个种群个体进行片段组装形成新的种群;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810438596.1/2.html,转载请声明来源钻瓜专利网。