[发明专利]一种基于种群熵的阶段性蛋白质结构预测方法有效
申请号: | 201810762911.6 | 申请日: | 2018-07-12 |
公开(公告)号: | CN109243525B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 张贵军;刘俊;王柳静;彭春祥;周晓根;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于种群熵的阶段性蛋白质结构预测方法,在差分进化算法的框架下,利用种群中个体状态间的转变选择不同的变异策略,在全局探测和局部增强间达到平衡。在探索阶段,利用排挤策略,使种群在进化的保证种群的多样性;在增强阶段,根据种群中个体状态间的转变构建马尔科夫模型,根据构建马尔科夫型计算种群熵值,再根据计算的熵值信息指导下一代种群中变异策略的选择,从而在全局探测和局部增强间达到平衡,在不断搜索更好的构象的同时避免陷入局部最优,提高构象空间的探索性能。本发明提供一种搜索效率和预测精度较高的基于种群熵的阶段性蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 种群 阶段性 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于种群熵的阶段性蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)输入预测蛋白质的序列信息;2)设置参数:种群规模NP,最大迭代次数G1、G2,交叉概率CR,聚类数K;3)种群初始化:迭代Rosetta协议第一、二阶段,产生具有NP个个体的种群P={P1,P2,...,PNP};4)探索阶段,过程如下:4.1)设g1=1,其中g1∈{1,2,...,G1};4.2)设n1=1,其中n1∈{1,2,...,NP};4.3)令表示种群P中的第n1个个体;4.4)变异操作,过程如下:4.4.1)从种群P中随机选择两个互异且不同于的个体Pselect1、Pselect2;4.4.2)在[0,L‑9]内生成均匀随机整数rand1和rand2,其中L表示氨基酸序列长度;4.4.3)将Ptarget的第rand1至rand1+8号残基的二面角值替换成Pselect1对应残基号的二面角值,将Ptarget的第rand2至rand2+8号残基的二面角值替换成Pselect2对应残基号的二面角值;4.5)生成均匀随机小数rand3,rand3∈[0,1];若CR<rand3,转至步骤4.6);否则,执行交叉操作,过程如下:4.5.1)在[0,L‑9]内生成均匀随机整数rand4;4.5.2)将Ptarget的第rand4至rand4+8号残基的二面角值替换成对应残基号的二面角值;4.6)利用Rosetta协议第三阶段对Ptarget执行局部搜索操作,生成构象Ptrial;4.7)选择操作,过程如下:4.7.1)计算Ptrial与种群P中除外的每一个个体之间的均方根偏差RMSD,并选出与Ptrial的RMSD最小的个体Pselect;4.7.2)用Rosetta score5能量函数计算Ptrial和Pselect的能量,并根据Metropolis准则决定是否用Ptrial替换种群P中的个体Pselect;4.8)n1=n1+1;若n1≤NP,转至步骤4.3);4.9)g1=g1+1;若g1≤G1,转至步骤4.2);否则结束探索阶段;5)利用PAM聚类方法对种群P进行聚类,过程如下:5.1)计算种群P中任意两个个体的RMSD,得到相异度矩阵D(NP×NP),Dmn表示种群中第m个个体与第n个个体的RMSD,其中m和n均∈{1,2,...,NP};5.2)根据相异度矩阵D(NP×NP),利用PAM聚类方法对种群进行聚类,得到K个聚类中心以及每个类所包含的个体;6)增强阶段,过程如下:6.1)令6.2)设g2=1,其中g2∈{1,2,...,G2};6.3)设n2=1,其中n2∈{1,2,...,NP};6.4)令表示种群Pnew中的第n2个个体;6.5)变异操作,过程如下:6.5.1)若g2=1,执行步骤6.5.2);否则,转至步骤6.5.3);6.5.2)第一代变异操作,过程如下:6.5.2.1)从种群Pnew中随机选择两个互异且不同于的个体6.5.2.2)在[0,L‑3]内生成均匀随机整数rand5和rand6,其中L表示氨基酸序列长度;6.5.2.3)将Ptarget的第rand5至rand5+2号残基的二面角值替换成对应残基号的二面角值,将Ptarget的第rand6至rand6+2号残基的二面角值替换成对应残基号的二面角值;6.5.2.4)转至步骤6.6);6.5.3)生成均匀随机小数rand7,rand7∈[0,1];若在步骤6.11)中计算的相邻两代种群间的熵值E≥rand7,执行步骤6.5.4);否则,执行步骤6.5.5);6.5.4)利用熵值E指导变异操作,过程如下:6.5.4.1)从种群Pnew中选出能量最低的两个个体6.5.4.2)在[0,L‑3]内生成均匀随机整数rand8和rand9,其中L表示构象Ptarget的残基数;6.5.4.3)将Ptarget的第rand8至rand8+2号残基的二面角值替换成对应残基号的二面角值,将Ptarget的第rand9至rand9+2号残基的二面角值替换成对应残基号的二面角值;6.5.5)无熵值E指导的变异操作,过程与步骤6.5.2)相同;6.6)生成均匀随机小数rand10,rand10∈[0,1];若CR<rand10,转至步骤6.7);否则,执行交叉操作,过程如下:6.6.1)在[0,L‑3]内生成均匀随机整数rand11;6.6.2)将Ptarget的第rand11至rand11+2号残基的二面角值替换成对应残基号的二面角值;6.7)利用Rosetta协议第四阶段对Ptarget执行局部搜索操作,生成构象Ptrial;6.8)用Rosetta score3能量函数计算Ptrial和的能量;根据Metropolis准则决定是否用Ptrial替换种群Pnew中的个体6.9)n2=n2+1;若n2≤NP,转至步骤6.4);6.10)保持K个聚类中心不变,重新划分聚类,过程如下:6.10.1)设n=1,其中n∈{1,2,...,NP};6.10.2)计算种群Pnew中第n个个体与K个聚类中心的RMSD,将划分到与其RMSD最小的聚类中心所在的类;6.10.3)n=n+1;若n≤NP,转至步骤6.10.2);6.11)计算相邻两代种群间的熵值,过程如下:6.11.1)根据相邻两代种群P和Pnew的K个类中个体的相互转移确定转移矩阵T(K×K),Tij表示上一代种群P的第i个类中的个体在新一代种群Pnew转移到第j个类的概率,其中i和j均∈{1,2,...,K};6.11.2)根据公式计算熵值;6.12)P=Pnew;6.13)g2=g2+1;若g2≤G2,转至步骤6.3);否则结束增强阶段;7)根据Rosetta聚类算法对种群P中的个体聚类,选出最大类的类心构象作为最终预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810762911.6/,转载请声明来源钻瓜专利网。