[发明专利]一种基于Loop区域高斯扰动的群体蛋白质结构预测方法有效
申请号: | 201810762501.1 | 申请日: | 2018-07-12 |
公开(公告)号: | CN109326318B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 李章维;余宝昆;肖璐倩;刘俊;彭春祥;周晓根;张贵军 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于Loop区域高斯扰动的群体蛋白质结构预测方法,首先,通过种群初始化得到全局搜索的构象;然后通过交叉操作,交叉种群中个体Loop区域的部分;其次,对交叉后的种群和初始种群合并到一起挑选出能量较小的个体,使用高斯分布的二面角来对构象的Loop区域扰动,并使用玻尔兹曼概率判断是否接收;最后使用聚类算法对输出的最后一代种群聚类,得到最终的蛋白质三级结构。本发明提供一种预测精度较高的基于Loop区域高斯扰动的群体蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 loop 区域 扰动 群体 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于Loop区域高斯扰动的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)参数设置:设置初始种群大小NP,交叉概率CR,种群交叉代数G,最大迭代次数Gmax,温度参数KT,扰动参数a,设置能量函数;2)使用PSIPRED服务器预测目标序列的二级结构,得到每个残基的二级结构,标记二级结构为Loop类型的残基;3)设置蛋白质构象的初始种群为{x1,x2,...,xNP},其中xi,i∈[1,NP]表示种群的第i个个体,对种群所有个体进行片段组装,直到个体中所有位置的残基都被替换一次,则完成初始化操作,初始化操作后得到种群P;4)种群交叉操作,过程如下:4.1)对种群P中的NP个个体两两配对,组成NP/2对,并对其编号a1,a2,...,aNP/2,,其中aj,j∈[1,NP/2]表示第j组;4.2)随机选择其中的一组aj,根据交叉概率CR判断是否对这两个个体进行交叉,若random(0,1)<CR,则随机选取这一组个体的对应的Loop区域交换它,形成两个新的子代,否则,保留aj中个体不变,遍历所有组后得到交叉后的种群P′;5)把交叉后的种群P′和初始种群P合并,使用能量函数计算种群P′∪P中每个个体的能量,根据能量的高低对种群的个体排序,挑选出能量较低的前NP个个体组成新的种群;6)对Loop区域二面角高斯扰动,过程如下:6.1)选择种群中的一个个体xi,随机选择xi的一个Loop区域,通过(1)式产生独立的高斯随机数ψ,通过(2)得到扰动后的角度ψ=(‑ln R1)1/2cos2πR2 (1)其中R1和R2是在(0,1)之间均匀分布的随机数字,ψ表示独立的高斯随机数,表示扰动前的角度,表示扰动后的角度,a表示扰动参数;6.2)使用新得到的角度替换该Loop区域的二面角得到新的个体x′i,使用能量函数对个体xi和xi′计算能量得到E(xi)和E(xi′),使用玻尔兹曼概率P=exp{‑[E(xi′)‑E(xi)]/KT}判断是否进行二面角的替换,其中KT是温度参数,若random(0,1)<P,保留个体xi′,否则,保留原个体xi;7)对种群所有个体执行步骤4)‑6)操作后,设置G=G+1,判断G是否达到最大迭代次数,若G≤Gmax,则返回步骤4),否则,进行步骤8);8)输出最后一代的种群,使用K均值聚类方法挑出最大类的类心构象作为最终结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810762501.1/,转载请声明来源钻瓜专利网。