[发明专利]一种基于拉氏图的群体蛋白质结构预测方法有效
申请号: | 201810238720.X | 申请日: | 2018-03-22 |
公开(公告)号: | CN108629151B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 李章维;余宝昆;孙科;肖璐倩;王柳静;郝小虎;周晓根;张贵军 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于拉式图的群体蛋白质结构预测方法,首先,根据群体的初始化得到全局搜索后的构象;然后,把初始化后的群体进行交叉变异得到新的群体,增加了群体的多样性信息;其次,合并初始群体和交叉变异后的群体,使用能量函数计算种群个体的能量,挑选优秀的个体组成新的群体;最后,通过从拉氏图中采样更新个体的Loop区域,使用能量函数判断是否接收,输出最终的构象。本发明提供一种预测精度较高的基于拉式图的群体蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 拉氏图 群体 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于拉氏图的群体蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)参数设置,过程如下:设置蛋白质群体的构象为P={x1,x2,...,xi,...xN},i∈[1,N],其中xi表示群体的第i个个体,预测蛋白的序列长度为l,群体规模为N,交叉概率CR,变异概率f∈{3,9}为片段插入长度,交叉变异代数G,拉氏图采样代数t,最大迭代代数Gmax,设置能量函数;2)构建目标蛋白的拉氏图,过程如下:在Rosetta中,将拉氏图的横纵坐标以d为间隔,分成n×n个格子,不同氨基酸所允许的二面角角度ψ和φ不均匀的分布到在这些格子中,计算得到拉氏图中残基二级结构为Loop的每个格子的的二面角分布概率,对其进行归一化处理得到{p1,p2,...,pk},k∈[1,n×n];3)群体初始化,过程如下:对于个体xi,对群体进行片段组装,直到所有位置的残基都被替换一次,则完成初始化操作,初始化所有个体得到群体P′;4)群体交叉,过程如下:4.1)对群体P′中的N个个体两两配对,组成N/2对,并对其编号a1,a2,...,aN/2,,其中aj,j∈[1,N/2]表示第j组;4.2)随机选择其中的一组aj,根据概率CR判断是否对这两个个体进行交叉,若交叉,则随机选取这一组个体的Loop区域交换它,形成两个新的子代,否则,保留aj中个体不变,遍历所有组后得到交叉后的种群P″;5)群体变异,过程如下:对于P″中的个体xi,使用概率判断是否进行变异,若变异,则仅对包含Loop类型残基的窗口使用片段长度为f的片段组装,当插入窗口中包含Loop和非Loop残基时,仅对Loop类型的残基变异,非Loop类型残基不变,操作后得到新个体x′i,遍历群体中的每一个个体,对每个个体执行变异操作,得到新的群体P*;6)使用能量函数对群体P′UP*打分,对个体按照分数高低升序排列,挑选出前N个能量较低的个体,组成群体P*′,操作结束设置G=G+1;7)判断是否达到最大迭代代数:若G≤Gmax,则返回步骤4);否则,结束循环并输出最后一代群体信息,进入步骤8);8)拉氏图采样,过程如下:选取P*′的一个个体xi,随机选取xi的一段Loop区域,从拉氏图中根据每个格子的概率选取一个格子,使用这个格子的二面角信息来替换该Loop区域中每个残基的二面角,得到新的构象x′i,使用能量函数对构象xi和x′i分别使用能量函数计算能量得到E(x′i)和E(xi),若E(x′i)<E(xi),则保留构象x′i,若E(x′i)>E(xi),使用玻尔兹曼概率p判断是否接收采样信息的替换,若random(0,1)<p,则保留个体x′i,否则,保留个体xi,对群体所有个体采样替换后,设置t=t+1;9)判断是否满足终止条件,若t<Gmax,返回步骤8),否则,结束循环并输出最后一代个体。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810238720.X/,转载请声明来源钻瓜专利网。