[发明专利]一种基于多样性指标的群体蛋白质构象空间优化方法有效
申请号: | 201810438596.1 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108595910B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 张贵军;彭春祥;刘俊;周晓根;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00;G06N3/00;G06N3/12 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于多样性指标的群体蛋白质构象空间优化方法,首先,利用Rosetta第一阶段进行片段组装生成初始种群,并利用Rosetta第二阶段进行片段组装生成新种群;然后,针对随机选取的Loop区域,对构象进行Loop交换,从而实现种群重组;其次,基于Loop区域,对每个构象进行变异操作,并将变异生成的所有新个体与当前种群进行合并,并提取构象的USR特性信息建立多样性指标,基于该指标和能量对整个种群进行更新操作;最后,分别利用Rosetta第三和第四阶段对整个种群进行进一步优化,从而得到最终预测结果。本发明采样效率较高、多样性较好、复杂度较低及预测精度较高。 | ||
搜索关键词: | 一种 基于 多样性 指标 群体 蛋白质 构象 空间 优化 方法 | ||
【主权项】:
1.一种基于多样性指标的群体蛋白质构象空间优化方法,其特征在于,所述优化方法包括以下步骤:1)给定输入序列信息;2)设置参数:种群大小NP,重组因子RC,最大迭代代数Gmax,多样性接收概率p;3)利用PSIPRED预测查询序列的二级结构信息;4)初始化:首先通过用Rosetta第一阶段进行片段组装生成一个规模为NP的初始种群P={xi|i∈I},其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,NP},xi表示第i个个体;5)采用Rosetta第二阶段的局部搜索策略对每个种群个体进行片段组装形成新的种群;6)构象重组,过程如下:6.1)从当前种群中选择两个不同的个体xa和xb,其中,a,b∈{1,2,...,NP},a≠b;根据二级结构信息随机选取一个loop区域,并在0和1之间随机生成一个均匀分布随机数rand1;6.2)如果rand1<RC,则针对步骤6.1)中选择的loop区域,交换构象xa和xb的二面角分别生成新的构象和6.3)重复步骤6.1‑6.2)直到种群中的所有个体都进行了构象重组为止,生成新的种群7)针对种群中的每一个构象进行变异,过程如下:7.1)统计所有loop区域能够进行片段组装位置的数量WL,并计算变异概率7.2)生成一个0和1之间的均匀分布随机数rand2,如果rand2<Pm,则对构象的所有loop区域进行一次片段组装生成变异个体7.3)按照步骤7.1)‑7.2)对当前种群中的所有构象进行变异后,生成新的种群8)合并种群和P中的所有个体,即9)针对中的每一个构象计算多样性指标,过程如下:9.1)根据每个构象的Cα原子坐标计算每个构象的质心9.2)计算每个Cα原子到质心的欧氏距离,并记离质心最远的原子为离质心最近的原子为9.3)计算每个Cα原子到的欧氏距离,并记离最远的原子为9.4)分别计算步骤9.2)中所有距离的平均值偏差偏度9.5)分别计算步骤9.3)中所有距离的平均值偏差偏度9.6)计算每个Cα原子到的距离,并计算这些距离的平均值偏差偏度9.7)计算每个Cα原子到的距离,并计算这些距离的平均值偏差偏度9.8)将步骤9.4)‑9.7)中的距离平均值、偏差和偏度合并得到构象的特征向量9.9)计算多样性指标其中,T={1,2,…,2NP};表示向量Ui的第l维元素;10)针对种群P中的每一个个体xi,i∈I进行更新,过程如下:10.1)分别根据Rosetta score2计算个体xi和的能量score(xi)和10.2)如果则个体替换父代个体xi,否则继续步骤10.3);10.3)如果Di>D′i,则产生一个[0,1]的随机数rand3,如果rand3>p,则个体替换父代个体xi;11)对步骤6)‑10)进行迭代直到达到最大代数Gmax,然后继续步骤12);12)采用Rosetta第三阶段的局部搜索策略对每个种群个体进行片段组装形成新的种群,并根据步骤6)‑10)进行迭代直到达到最大代数Gmax,其中能量函数采用Rosetta socre3;13)采用Rosetta第四阶段的局部搜索策略对每个种群个体进行片段组装形成新的种群,并根据步骤6)‑10)进行迭代直到达到最大代数Gmax,其中能量函数采用Rosetta socre4;14)输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810438596.1/,转载请声明来源钻瓜专利网。