[发明专利]一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法有效
申请号: | 201610265960.X | 申请日: | 2016-04-26 |
公开(公告)号: | CN106096328B | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 张贵军;周晓根;俞旭锋;郝小虎;王柳静;徐东伟;李章维 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法,首先,根据能量值选取当前种群中的最优构象,计算其他构象到最优构象的距离,并根据距离对所有构象进行排名;然后,选取离最优构象最近的部分构象建立Lipschitz下界支撑面,计算所选取的构象的能量下界估计值,并计算实际能量值与下界估计值的平均误差;最后,根据平均误差将算法分为两层,第一层随机选取构象进行片段组装生成新构象,第二层则根据最优构象进行片段组装生成新构象,从而引导算法快速可靠地向能量最低的区域收敛。本发明预测精度高、计算代价较低。 | ||
搜索关键词: | 一种 基于 局部 lipschitz 支撑 双层 进化 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于局部Lipschitz支撑面的双层差分进化蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)选取力场模型:采用Rosetta力场模型能量函数的表示形式如下
式中,E表示蛋白质的总能量,Einter rep表示范德华排斥力作用,Einter atr表示范德华吸引力作用,Esolvation为Lazarids和Karplus描述的隐含的溶解作用,Ebb/sc hb、Ebb/bb hb和Esc/sc hb为依赖方向的氢键能量,Epair残基对静电作用,Edunbrack为氨基酸基于旋转异构体库的内部的能量,Erama为参考特定位置的Ramachandrin骨链扭力,Ereference为未折叠态的蛋白质的参考能量,Winter rep、Winter atr、Wsolvation为Einter rep、Einter atr、Esolvation的能量项权重,Wbb/sc hb、Wbb/bb hb和Wsc/sc hb分别为Ebb/sc hb、Ebb/bb hb和Esc/sc hb的能量项权重,Wpair、Wdunbrack、Wrama和Wreference分别为Epair、Edunbrack、Erama和Ereference的能量项权重;2)给定输入序列信息;3)设置参数:能量函数的各能量项权重值,种群大小NP,交叉因子CR,常数M;4)种群初始化:由输入序列产生初始构象种群![]()
其中,N表示维数,
表示第i个构象Ci的第N维元素,并初始化迭代次数G=0;5)根据式(1)计算当前种群中的每个构象的能量值f(Ci)=E(Ci),选取能量最低的构象Cbest=(xbest,1,xbest,2,…,xbest,N),计算其他构象Ci到Cbest的欧式距离
其中,
为第i个构象Ci的第j维元素,xbest,j为Cbest的第j维元素;6)根据各构象的欧式距离di进行升序排列,选取排名前NP/5的构象Ck,k=1,…,NP/5,对选取的每个构象构建Lipschitz下界估计支撑面
其中,f(Ck)为构象Ck的能量函数值,
为辅助变量,M为常数;7)根据所构建的下界估计支撑面计算所选取的NP/5个构象的下界估计值
其中max表示求最大值,min表示求最小值,
为支撑向量lk的第j维元素;8)计算所选取的NP/5个构象Ck的下界估计值
和实际能量值f(Ck)之间的平均误差
9)针对种群中的每个构象个体Ci,i∈{1,2,3,…,NP},令Ctarget=Ci,Ctarget表示目标构象个体,执行以下操作生成变异构象Cmutant:9.1)随机生成正整数rand1,rand2,rand3,rand1,rand2和rand3均∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4,randrange1,randrange2,randrange3和randrange4均∈{1,2,…,L},L为序列长度;其中randrange1≠randrange2,randrange3≠randrange4;9.2)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),s∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;9.3)如果σ>0.5,可以判定处于第一层搜索,用Crand2上位置a到位置b的片段的氨基酸s所对应的二面角phi、psi、omega替换Crand1的相同位置所对应的二面角phi、psi、omega;再使用Crand3上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换Crand1上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1进行片段组装得到变异构象个体Cmutant;9.4)如果σ≤0.5,可以判定处于第二层搜索,则用Crand1上位置a到位置b的片段的氨基酸s所对应的二面角phi、psi、omega替换Cbest的相同位置所对应的二面角phi、psi、omega;再使用Crand2上位置c到位置d的片段的氨基酸p所对应的二面角phi、psi、omega替换Cbest上相同位置所对应的二面角phi、psi、omega,然后将所得Cbest进行片段组装得到变异构象个体Cmutant;10)对变异构象Cmutant执行交叉操作生成测试构象Ctrial:10.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L);10.2)若随机数rand4≤CR,Ctrial由变异构象Cmutant的片段rand5替换为目标构象Ctarget中对应的片段生成,否则Ctrial直接等于变异构象Cmutant;11)如果f(Ctrial)<f(Ctarget),则测试构象Ctrial替换目标构象Ctarget;12)判断是否满足终止条件,若满足则输出结果并退出,否则返回步骤5)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610265960.X/,转载请声明来源钻瓜专利网。
- 上一篇:设计成安装在可移除的支承件上的手表
- 下一篇:金融设备
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用