[发明专利]一种基于进化搜索的蛋白质构象空间优化方法在审
申请号: | 202110299297.6 | 申请日: | 2021-03-21 |
公开(公告)号: | CN112967751A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 彭绍亮;陈健;王小奇;陈东;李肯立 | 申请(专利权)人: | 湖南大学 |
主分类号: | G16B10/00 | 分类号: | G16B10/00;G16B15/00;G06N3/12 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 王文惠 |
地址: | 410012 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 进化 搜索 蛋白质 构象 空间 优化 方法 | ||
本发明属于生物信息学、智能优化、计算机应用领域,公开了基于进化搜索的蛋白质构象空间优化方法。本发明包括:用氨基酸序列在第0代时的随机构象初始化种群;将种群中个体按照势能值排序;选择低势能个体作为当前采样前的父代个体,对每一个父代个体应用片段替换技术进行修改生成子代个体;对得到的每一个子代个体,应用最小化策略进行一系列的片段替换运动,映射到附近的极小值状态;将经过最小化策略处理后的所有子代个体与种群中其他个体形成的并集经过截断选择后选出新的种群。本发明改进了基本进化方法的不足,如:容易过早收敛到次优区域。本发明借助于以局部贪婪搜索为特征的最小化步骤,实现了采样能力更高的蛋白质构象空间探索方法。
技术领域:
本发明涉及生物学信息学、智能优化、计算机应用领域,尤其涉及的是一种基于进化搜索的蛋白质构象空间优化方法。
背景技术:
蛋白质结构预测是计算结构生物学领域一直以来的研究热点之一。蛋白质分子由20种常见的氨基酸组成,在其生物活性状态下通常维持一定的立体结构,并发挥相应的功能。
在蛋白质结构研究中,虽然X射线晶体衍射、核磁共振、冷冻电镜等实验技术能够较准确地提取到蛋白质天然结构中的原子坐标,但实验方法在能够应用的目标、研究的分辨率以及质量等方面,都存在一定的局限性。尤其对于药物设计的主要靶标膜蛋白来说,极难通过此类方法测定其三级结构。另一方面,在预测蛋白质三级结构的计算方法中,从头预测则考虑从氨基酸序列所提供的信息中来计算其天然结构。
从头预测领域主要面临两大挑战:构象空间的高维性和能量表面的崎岖不平。研究表明,已知目标序列,其所有可能的空间排布所构成的构象空间的大小随着序列长度的增加呈指数级增长。进化方法是一种用以解决复杂的搜索和优化问题的随机优化方法,是众多从头预测研究中用来探索蛋白质分子构象空间的首选搜索方法。但该方法在搜索过程中所表现出来的贪婪性质使得它在可能检测到天然结构的同时,容易过早收敛到构象空间的次优区域,明显降低搜索效率。
因此,可以对基本进化方法结合特定领域的技术做出适当的优化实现对现有问题的改进。
发明内容:
为了克服由于基本进化方法中过高的收敛性,从而陷入能量表面的局部极小值区域。本发明提出一种采样效率较高且能提高采样构象质量的基于进化搜索的蛋白质构象空间优化方法。
本发明解决其技术问题所采用的技术方案是:
一种基于进化搜索的蛋白质构象空间优化方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)参数初始化:设置种群规模Ps,当前种群的势能指标ECNT,能量评估预算Emin,初始种群搜索轨迹长度N,每一代采样数Numchild,运动计数器COUNT;
3)初始化种群:启动Ps条Monte Carlo轨迹,每条轨迹搜索N次,即生成Ps个初始构象;
4)对当前种群P,进行如下操作:
4.1)根据势能值从P中选出Numchild个低势能构象作为父代个体;
4.2)对父代个体xi进行如下的片段替换运动:
4.2.1)在所述父代个体序列上随机均匀地采样一个残基位置i,则对应产生一个由3个连续残基构成的片段[i,i+2],其中i为父代个体构象链上随机采样的残基编号;
4.2.2)针对目标片段,从其片段库中随机选择一个片段构型替换目标片段得到子代个体xi′;当处理完所有Numchild个父代个体时,进入步骤4.3),否则返回步骤4.2)处理下一父代个体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110299297.6/2.html,转载请声明来源钻瓜专利网。