[发明专利]基于差分进化和构象空间退火的蛋白质三维结构预测方法有效
申请号: | 201310299435.6 | 申请日: | 2013-07-15 |
公开(公告)号: | CN103473482A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 张贵军;程正华;姚春龙;邓勇跃;周晓根;陈先跑 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 进化 构象 空间 退火 蛋白质 三维 结构 预测 方法 | ||
技术领域
本发明涉及蛋白质三维结构预测技术领域,特别涉及一种基于差分进化和构象空间退火相结合的一种蛋白质三维结构预测方法,属于将现代智能优化方法应用到蛋白质三维结构的工程预测方法。
背景技术
随着人类基因组计划的完成和蛋白质的研究日益深入,在当今分子生物学领域中,蛋白质分子空间结构与功能的研究无疑是最具有挑战性的问题。三联密码的破译使人们掌握了遗传信息从DNA到氨基酸序列的复制规律,然而仅有氨基酸序列是不够的,氨基酸序列还必须形成一定的空间结构,才真正完成了蛋白质的合成,也才能行使其特定的生物功能,因此蛋白质结构的确定将是研究其生物功能的基础。同时蛋白质结构预测对于全新蛋白质分子设计、药物分子设计、生物和化学催化剂、光能-化学能-动能的转换、生物传感器、以及环境科学等许多领域都有深远的意义。特别是随着2000年基因组工作草图的完成,基因组的工作重心已经从测序转向了基因功能的识别,这一问题的解决显得尤为重要。人们通过研究蛋白质的内在结构来了解其内在机理,并找出蛋白质折叠的真正驱动力,这样可以按照人们的设想设计出符合特定需求的非天然蛋白质,对疾病进行有效的预测和控制。
然而蛋白质结构的测定远远赶不上基因组测序速度,X射线晶体学方法和多维核磁共振技术是目前测定蛋白质结构的主要物理方法。用X射线晶体学方法测定蛋白质结构不仅需要花相当长的时间,在技术上也受到相当大的限制;多维核磁共振技术能够有效测定蛋白质的结构,但仅适用于小蛋白。因此,单纯依靠试验方法测定所有蛋白质的空间结构远远不能满足后基因时代对于蛋白质数据分析的需求,有必要发展一种可靠的理论预测方法,从而迅速、简便的获取蛋白质的结构信息。
早在1961年,Anfinsen提出蛋白质一级结构完全决定其空间结构的著名论断,并因此获得诺贝尔奖,从此揭开了理论预测蛋白质结构的序幕。解决蛋白质空间结构预测问题可以分为三部曲:即首先进行形式化,将蛋白质结构抽象转化成一个数学模型;然后分析模型的可计算性;最后进行算法设计,从算法的时间和空间复杂度出发,寻找最优算法。理论计算方法(也称热力学方法)是一种常用的蛋白质结构预测方法,由于它仅利用一级序列信息进行预测,而不需要任何其他已知蛋白质结构信息,所以该方法是比较理想的预测方法。其基本假设是:一定环境中的天然蛋白质的三维结构是整个系统自由能最小的结构。要实现这一方法有两个关键:一是要有一个合理的势函数,势函数的全局极小值对应蛋白质的天然结构; 二是要有个好的算法,保证在有效的计算时间找到势能函数的全局最小。
目前,根据Anfinsen假设,直接从氨基酸序列出发,基于分子力场势能模型,采用全局优化方法,在其势能面上搜索蛋白质分子系统的最小能量状态,从而能够高通量、廉价地预测肽链的天然构像,已经成为生物信息学最重要的研究课题之一。由于蛋白质是一种强柔性的大分子体系,其势函数表达式极其复杂,存在极多局部极小点。据估计,N个残基的氨基酸序列,其局部极小点在10N以上,而迄今发现的蛋白质中肽链平均含300-500个氨基酸残基,所以有效解决全局优化问题是蛋白质结构预测中的一个关键。
近年来,许多随机全局优化算法陆续提出来解决蛋白质三维结构预测问题,如遗传算法、差分进化算法、构象空间退火算法。差分进化算法虽然具有较强的全局搜索能力和求解问题的能力,还具有简单、通用和并行处理等特点。但是用差分进化这种群体优化算法处理多模态优化问题时,由于使用了全局选择因子,算法只能收敛到全局最优解,而忽略了众多局部极值解;其次,模型的复杂性造成这些算法极易陷入某个局优解;同时差分这种随机算法缺乏全局收敛理论依据及解的不确定性,进一步限制了它们在实际问题中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310299435.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于网络架构的分析方法及其应用
- 下一篇:一种电能分项计量的方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用