[发明专利]一种系综构象选择策略自适应的蛋白质结构预测方法有效
申请号: | 201810994644.5 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109326320B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张贵军;马来发;谢腾宇;周晓根;王小奇;王柳静 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/30;G06N3/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种系综构象选择策略自适应的蛋白质结构预测方法,首先预测查询序列的二级结构信息,残基间接触信息,构建片段库;其次建立基于二级结构信息的相似性评分函数和基于残基间接触评价函数,设计交叉、变异、选择策略,设计基于二级结构相似性和能量的选择策略,利用种群二级结构相似性收敛性,设计三个选择策略的自适应概率函数;最后根据种群二级结构相似性评分函数值、残基间接触评价函数值和能量值实现种群更新,利用系综构象选择策略自适应的蛋白质结构预测方法能够有效地提高算法采样能力,构象能够形成好的二级结构,预测得到低能量的构象。本发明提供一种预测精度较高的系综构象选择策略自适应蛋白质结构预测方法。 | ||
搜索关键词: | 种系 构象 选择 策略 自适应 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种系综构象选择策略自适应的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)利用PSIPRED预测查询序列的二级结构信息,利用MetaPSICO预测查询序列的残基间距离接触信息;2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、输入查询序列、片段库、片段组装次数N和迭代次数g=0;3)对种群所有构象进行初始化,对种群中每个构象进行N次片段组装;4)构象交叉,操作如下:4.1)选择第i,i∈[1,NP]个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基被预测的二级结构的类型;4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到从交叉点p起预测的二级结构类型和交叉点p处对应的二级结构类型不同为止,产生一个新构象C′i;5)构象变异,对构象C′i和C′j,变异过程如下:对构象C′i进行3残基片段组装,对C′j进行9残基片段组装,生成两个构象C″i和C″j;6)分别对构象C″i和C″j求二级结构相似性分值Ess:
其中L是查询序列长度,
是查询序列第l个残基预测的二级结构,
是测试构象的第l个残基的二级结构,其值由DSSP求得;7)分别对构象C″i和C″j求残基间距离约束分值Eco:
其中N是残基接触总数,
是查询序列第k个残基对p和q被预测为有接触的置信度,
是测试构象的第k个残基对p和q之间的Cα距离,dcon是预测为接触的阈值,
8)求种群中每个构象的二级结构相似性分值Ess,计算种群二级结构相似性分值的平均值
和方差σ;9)根据平均值
和方差σ,求选择策略切换概率pse:
其中L是查询序列的长度,
和σ分别是种群二级结构相似性分值的平均值和方差;10)基于选择策略切换概率pse进行选择,过程如下:10.1)产生一个随机数r′,r′∈[0,1],如果r′E″,则用E″对应的构象替换种群中E′对应的构象,否则保持种群不变;11)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出能量最低的构象作为最后预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810994644.5/,转载请声明来源钻瓜专利网。