[发明专利]一种基于副本交换和局部增强策略的群体构象空间搜索方法有效
申请号: | 201510310103.2 | 申请日: | 2015-06-08 |
公开(公告)号: | CN105046101B | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 张贵军;郝小虎;俞旭锋;周晓根;陈凯;徐东伟 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构象 局部增强 空间搜索 副本 差分进化算法 算法 群体 交换 全局搜索能力 采样能力 局部构象 局部搜索 能量模型 片段组装 粗粒度 引入 采样 维数 收敛 种群 多样性 预测 | ||
一种基于副本交换和局部增强策略的群体构象空间搜索方法,在差分进化算法框架下,采用Rosetta Score3粗粒度知识能量模型来有效降低构象空间搜索维数、提高算法的收敛速度;引入基于知识的片段组装技术可以有效提高预测精度;利用Monte Carlo算法良好的局部搜索性能对种群做局部增强,以得到更为优良的局部构象,结合差分进化算法较强的全局搜索能力,可以对构象空间进行更为有效的采样,副本交换策略的引入使得群体的多样性以及空间采样能力得到进一步增强。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于副本交换和局部增强策略的群体构象空间搜索方法。
背景技术
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。因此,要了解蛋白质的功能,就必须获得其三维空间结构。
蛋白质三级结构预测是生物信息学的一个重要任务。蛋白质构象优化问题现在面临最大的挑战是对极其复杂的蛋白质能量函数曲面进行搜索。蛋白质能量模型考虑了分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,构象对应局部极小解数目随序列长度的增加呈指数增长。而蛋白质构象预测算法能够找到蛋白质稳定结构的机理是,大量的蛋白质亚稳定结构构成了低能量区域,所以能否找到蛋白质全局最稳定结构的关键是算法能够找到大量的蛋白质亚稳定结构,即增加算法的种群多样性。因此,针对更加精确的蛋白质力场模型,选取有效的构象空间优化算法,使新的蛋白质结构预测算法更具有普遍性和高效性成为生物信息学中蛋白质结构预测的焦点问题。
目前,蛋白质结构预测方法大致可以分为两类,基于模板的方法和不基于模板的方法。其中,不基于模板的从头预测(Ab-inito)方法应用最为广泛。它适用于同源性小于25%的大多数蛋白质,仅从序列产生全新结构,对蛋白质分子设计及蛋白质折叠的研究等具有重要意义。当前有以下几种比较成功的从头预测方法:张阳与Jeffrey Skolnick合作的TASSER(Threading/Assembly/Refinement)方法、David Baker及团队设计的Rosetta方法、Shehu等设计的FeLTr方法等。但是到目前还没有一种十分完善的方法来预测蛋白质的三维结构,即使获得了很好的预测结果,但也只是针对某些蛋白质而言的,目前主要的技术瓶颈在于两个方面,第一方面在于采样方法,现有技术对构象空间采样能力不强,另一方面在于构象更新方法,现有技术对构象的更新精度仍然不足。
因此,现有的构象空间搜索方法存在不足,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法的构象空间搜索维数较高、收敛速度较慢、预测精度较低的不足,本发明基于差分进化群体算法,提出一种基于副本交换和局部增强策略的群体构象空间搜索方法,RELEDE:在差分进化算法框架下,采用Rosetta Score3粗粒度知识能量模型来有效降低构象空间搜索维数、提高算法的收敛速度;引入基于知识的片段组装技术可以有效提高预测精度;利用Monte Carlo算法良好的局部搜索性能对种群做局部增强,以得到更为优良的局部构象,结合差分进化算法较强的全局搜索能力,可以对构象空间进行更为有效的采样,副本交换策略的引入使得群体的多样性以及空间采样能力得到进一步增强。
本发明解决其技术问题所采用的技术方案是:
一种基于副本交换和局部增强策略的群体构象空间搜索方法,所述搜索方法包括以下步骤:
1)给定输入序列信息;
2)设置系统参数:种群大小popSize,算法的迭代次数T,交叉因子CR,片段的长度L,副本层数RE,副本层温度参数kT;
3)种群初始化:在每个副本层,由输入序列产生popSize个种群个体P
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510310103.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种压盒机构
- 下一篇:一种塑料袋一体式生产设备
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用