[发明专利]一种基于二级结构动态选择策略的蛋白质结构预测方法有效
申请号: | 201810993744.6 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109378035B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 张贵军;马来发;王小奇;周晓根;郝小虎;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于二级结构动态选择策略的蛋白质结构预测方法,包括以下步骤:首先预测查询序列的二级结构信息,构建片段库;其次建立基于二级结构信息的相似性评分函数,设计交叉、变异策略,设计基于二级结构相似性和能量的选择策略,利用种群二级结构相似性收敛性,设计两个选择策略的动态切换概率函数;最后根据种群二级结构相似性收敛性和能量值实现种群更新,利用基于二级结构动态选择策略能够有效地提高算法采样能力,构象能够形成好的二级结构。本发明提供一种预测精度较高的基于二级结构动态选择策略的蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 二级 结构 动态 选择 策略 蛋白质 预测 方法 | ||
【主权项】:
1.一种基于二级结构动态选择策略的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入查询蛋白的氨基酸序列,利用PSIPRED预测查询序列的二级结构信息,利用Robetta构建查询序列的片段库;2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、输入查询序列、片段库和迭代次数g=0;3)对种群所有构象进行初始化,对种群中每个构象进行片段组装,利用片段库中相应位置的片段的二面角替换构象中对应位置上的残基二面角,直到所有的残基二面角至少被替换过一次;4)构象交叉,操作如下:4.1)选择第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则继续步骤4.2),否则跳至步骤5);4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生两个新构象C′i和C′j;5)构象变异,对构象C′i和C′j,变异过程如下:5.1)对构象C′i进行3残基片段组装,对C′j进行9残基片段组装,生成两个构象C″i和C″j;5.2)分别对构象C″i和C″j求二级结构相似性分值Ess:
其中L是查询序列长度,
是查询序列中第l个残基预测的二级结构,
是测试构象的第l个残基的二级结构,其值由DSSP求得;5.3)从构象C″i和C″j中选择二级结构相似得分E′ss最高的构象作为变异成功构象;6)求种群中每个构象的二级结构相似性分值Ess,计算种群二级结构相似性分值的平均值
和方差σ;7)根据平均值
和方差σ,求选择策略切换概率pse:
其中L是查询序列的长度,
和σ分别是种群二级结构相似性分值的平均值和方差;8)基于选择策略切换概率pse进行选择,过程如下:8.1)产生一个随机数r′,r′∈[0,1],如果r′E″,则用E″对应的构象替换种群中E′对应的构象,否则保持种群不变;9)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出能量最低的构象作为最后预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810993744.6/,转载请声明来源钻瓜专利网。