[发明专利]一种多级个体筛选进化蛋白质结构预测方法有效
申请号: | 201810762603.3 | 申请日: | 2018-07-12 |
公开(公告)号: | CN109243524B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 张贵军;郝小虎;马来发;周晓根;王柳静;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多级 个体 筛选 进化 蛋白质 结构 预测 方法 | ||
一种多级个体筛选进化蛋白质结构预测方法,包括以下步骤:参数设置并初始化种群;基于进化算法框架,采用Rosetta score3能量函数作为优化目标,使用片段组装技术作为的变异策略,增加同代种群多样性,多级个体筛选方法用于进一步增加不同代种群间的多样性,并采用Monte Carlo算法对每个个体做局部增强得到当前的局部最优解,最终可以获得全局最优结构。本发明提供了一种有效的蛋白质结构从头预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种多级个体筛选进化蛋白质结构预测方法。
背景技术
人类基因组序列图的成功绘制,意味着人类基因组计划的所有预定目标全部实现,也标志着人类基因组计划的胜利完成和后基因组时代的来临。在后基因组时代,研究工作的重心从基因测序转向了基因组功能的识别:根据蛋白质分子的氨基酸序列预测其空间结构。这将使人们更系统的理解生物信息从DNA到具有生物活性蛋白质的遗传信息传递过程,使中心法则得到更为详尽的阐明,进而对生命过程中的各种现象有进一步的深刻认识,最终推动生命科学的向前发展。蛋白质结构预测除了其自身的理论意义外,还具有很重要的实际应用意义。人们希望通过研究蛋白质的空间结构来了解其内在机理,这样不仅可以对疾病进行有效的预测和控制,还可以按照人们的设想设计出符合特定需求的非天然蛋白质。
蛋白质构象优化问题现在面临最大的挑战是对极其复杂的蛋白质能量函数曲面进行搜索。蛋白质能量模型考虑了分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,构象对应局部极小解数目随序列长度的增加呈指数增长。而蛋白质构象预测算法能够找到蛋白质稳定结构的机理是,大量的蛋白质亚稳定结构构成了低能量区域,所以能否找到蛋白质全局最稳定结构的关键是算法能够找到大量的蛋白质亚稳定结构,即增加算法的种群多样性。因此,针对更加精确的蛋白质力场模型,选取有效的构象空间优化算法,使新的蛋白质结构预测算法更具有普遍性和高效性成为生物信息学中蛋白质结构预测的焦点问题。
因此,我们需要发展有效的蛋白质结构从头预测方法。
发明内容
针对上述问题,本发明提出了一种多级个体筛选进化蛋白质结构预测方法。基于进化算法框架,采用Rosetta score3能量函数作为优化目标,使用片段组装技术作为的变异策略,增加同代种群多样性,多级个体筛选方法用于进一步增加不同代种群间的多样性,并采用Monte Carlo算法对每个个体做局部增强得到当前的局部最优解,最终可以获得全局最优结构。
本发明解决其技术问题所采用的技术方案是:
一种多级个体筛选进化蛋白质结构预测方法,所述优化方法包括以下步骤:
1)参数设置:种群大小popSize,蛋白质序列长度Length,算法的迭代次数Generation,蛋白质片段的长度L1,L2;
2)初始化种群:对给定的蛋白质序列,从对应片段库中随机选取片段长度为L1,L2的片段分别进行Length-L1,Length-L2次片段组装,产生包含popSize个个体的种群Pint;
3)在达到设定的终止条件前,执行以下操作:
3.1)对种群Pint中每个个体Pi做以下操作,其中i∈{1,2,3,…,popSize}是种群中个体索引值,过程如下:
3.1.1)对Pi做片段长度为L1的片段组装,生成变异个体PL1:
a:令Pi.phi(j)←Phi(j);
b:令Pi.psi(j)←Psi(j);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810762603.3/2.html,转载请声明来源钻瓜专利网。