[发明专利]一种基于距离约束副本交换的蛋白质结构预测方法在审
申请号: | 201610268630.6 | 申请日: | 2016-04-26 |
公开(公告)号: | CN105975806A | 公开(公告)日: | 2016-09-28 |
发明(设计)人: | 张贵军;俞旭锋;周晓根;郝小虎;王柳静;张丹 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于距离约束副本交换的蛋白质结构预测方法,首先在每个温度层通过对查询序列进行随机的折叠和变换生成一个初始种群;在种群更新中,以Rosetta Score3为优化目标函数,基于Anfinsen提出的蛋白质天然态结构时自由能最低的结构,在每一个温度层中依次将种群中的每个个体作为目标个体,然后随机选取和目标个体不一样的两个个体进行变异、交叉产生变异个体,再将另一个个体随机选取一段与变异个体进行交换产生测试个体,再将测试个体与目标个体进行能量值比较,对于能量升高的测试个体引入距离谱的知识,将相邻的温度层的对应个体进行副本交换。本发明构象空间采样能力较好、预测精度高。 | ||
搜索关键词: | 一种 基于 距离 约束 副本 交换 蛋白质 结构 预测 方法 | ||
【主权项】:
一种基于距离约束副本交换的蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定输入序列信息;2)根据序列信息从QUARK服务器上获取距离谱文件DP,rpk为距离谱中记录下的残基对,Dk为该残基对之间的距离,其中k∈(1,N),N为距离谱中残基对数量;3)初始化:设置群体规模popSize,交叉概率CR,8个温度层T,能量函数选用Rosetta Score3,首先在每个温度层通过对查询序列随机的折叠和变换,生成一个规模为popSize的初始种群,初始群体为PT={xi|i∈I},计算能量函数值fT(xi),i∈I,并设
其中i为种群个体编号,I为种群个体编号集合,I={1,2,...,popSize},
为对应温度层能量函数值中的最小值,T为温度层;4)开始迭代,依次对每个温度层种群中的每个个体进行以下操作:4.1)设i=1,其中i∈{1,2,3,…,NP};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;4.2)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;4.3)针对个体Prand1做变异操作;4.3.1)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值;4.3.2)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Prand1上相同位置所对应的二面角phi、psi、omega,再将所得Prand1进行片段组装得到变异个体Pmutant;4.4)针对变异个体Pmutant做交叉操作;4.4.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);4.4.2)若随机数rand4<=CR,则使用目标个体Ptarget的片段rand5替换变异个体Pmutant中对应的片段生成测试个体Ptrail,否则Ptrail直接等于变异个体Pmutant;4.5)针对每个温度层中的目标个体Ptarget和测试个体Ptrail进行选择操作;4.5.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);4.5.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,并且进入4.6);否则继续执行4.5.3);4.5.3)计算目标个体Ptarget和测试个体Ptrail在残基对rpi的距离相对于距离谱中Di之间的距离差▽targetDi和▽trailDi;4.5.4)判断▽targetDi和▽trailDi的值,若大于6,则令其等于6,从而去除一些距离差值较大的异常数值;4.5.5)计算距离谱中所有位置的目标个体和测试个体的距离差值总和![]()
4.5.6)若▽Dtrail>▽Dtarget,则进入5);4.5.7)若▽Dtrail<▽Dtarget,则产生一个(0,1)之间的随机数rand6,若rand6小于0.2,则用Ptrail替换Ptarget,否则进行5);5)在每个温度层都进行变异、交叉和选择更新完种群后,将相邻的温度层的对应个体进行副本交换:5.1)首先选择种群中第i个个体,i∈I(i=1,2,…,popSize);5.2)选择两个相邻的温度层Tj和Tj+1,j=1,2,…,7;5.3)产生一个随机数randx∈(0,1),和判别数judge![]()
其中,
(i=1,2,···,popSize)为种群个体
的能量值,K为玻尔兹曼常数,Tj(j=1,2,…,7)为第j个温度层的开尔文温度,j为索引编号,e为自然常数;5.4)若randx<judge,将相邻温度层中的
和
个体进行交换;6)判断是否满足终止条件,如不满足则转至4);若满足则输出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610268630.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用