[发明专利]一种基于距离相似度的蛋白质构象空间搜索方法有效
申请号: | 201710717391.2 | 申请日: | 2017-08-21 |
公开(公告)号: | CN107633159B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 张贵军;王小奇;周晓根;王柳静;郝小虎;马来发 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于距离相似度的蛋白质构象空间搜索方法,在遗传算法的基本框架下,对每个目标个体完成交叉和变异操作;计算出目标个体残基间的空间距离值,并由这些空间距离值构成目标特征向量;然后,求出目标个体的特征向量与先验知识中目标蛋白的初始特征向量的Manhattan距离;同理,计算得到变异个体对应的变异特征向量以及对应的Manhattan距离;最后,根据Manhattan距离值和能量值选出优势个体,更新种群。本发明提出一种预测精度高、计算代价低的基于距离相似度的蛋白质构象空间搜索方法。 | ||
搜索关键词: | 一种 基于 距离 相似 蛋白质 构象 空间 搜索 方法 | ||
【主权项】:
一种基于距离相似度的蛋白质构象空间搜索方法,其特征在于:所述构象空间搜索方法包括以下步骤:1)给定输入序列信息;2)参数初始化:设置种群规模Pop_size,最大迭代次数Gmax,交叉因子CR,初始种群搜索轨迹长度iteration,交叉片段长度fragment,变异计数器counter,变异计数器的最大计数值counter_max,每个个体xi,i∈{1,2,...,Pop_size}的能量计算选用Rosetta Score3函数即E(xi),温度常数T,序列间隔num,先验知识中目标蛋白残基间的空间距离构成的初始特征向量V={v1,1+num,…,vk,k+num},k∈[1,length‑num],其中vk,k+num是第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离,length为序列长度,选择概率Ps;3)初始化种群:启动Pop_size条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成Pop_size个初始个体;4)对每个目标个体xi,i=1,.2..,Pop_size进行如下操作:4.1)随机选取个体xj,j∈{1,2,...,Pop_size}且j≠i,随机生成rand∈[0,1],若rand≤CR,则对个体xi和xj进行如下操作:4.1.1)随机生成整数begin∈[1,length‑fragment]作为交叉起始点,进而得到交叉区间[begin,end],其中begin+fragment=end为交叉终止点;4.1.2)在交叉区间[begin,end]内依次交换交个体xi和xj相应的扭转角度,生成新个体x′i,x′j;否则x′i=xi,x′j=xj,转至步骤4.2)4.2)对个体x′i,x′j进行如下的变异操作生成变异个体x″i,x″j:4.2.1)对个体x′i进行片段组装,利用Rosetta Score3函数E(xi)分别计算组装前后的能量值Ei和E′j;4.2.2)利用Monte Carlo机制即根据公式P(ΔE)=min{1,e‑ΔE/T}>random判断是否接收该片段的插入,其中random∈[0,1]的随机数,ΔE是个体x′i的在组装前后的能量变化值即ΔE=E′j‑Ei;4.2.3)如果接受则转至步骤4.2.5)否则转至4.2.4);4.2.4)变异计数器counter开始计数;若counter≤counter_max则依次执行步骤4.2.1)、4.2.2)和4.2.3)直到成功变异生成个体x″i为止;否则执行步骤4.2.1)生成变异个体x″i;最后,计数器counter清零;4.2.5)对个体x′j依次执行步骤4.2.1)、4.2.2)和4.2.3),生成变异个体x″j;4.3)根据目标个体xi和变异个体x″i、x″j的能量和距离相似度进行选择,选出优势个体并更新种群,过程如下:4.3.1)依次计算出目标个体xi的第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离进而得出目标特征向量4.3.2)计算目标个体xi的距离相似度其中d(Vxi,V)=Σk=1length-num(vk,k+numxi-vk,k+num);]]>4.3.3)对个体x″i执行步骤4.3.1)得出个体x″i对应的变异特征向量并根据计算出个体x″i相应的距离相似度sim_mutation_1;4.3.4)对个体x″j依次执行步骤4.3.1)得出个体x″j对应的特变异征向量并根据计算出个体x″j对应的距离相似度sim_mutation_2;4.3.5)根据Rosetta Score3函数分别计算出目标个体xi和个体x″i、x″j的能量值分别为energy_object,energy_mutation_1,energy_mutation_2;4.3.6)在个体xi和个体x″i、x″j中,如果某一个体Y∈{xi,x″i,x″j}的能量值和距离相似度均小于其他两个个体的能量值和距离相似度,则该个体为优势个体;如果某一个体Y′∈{xi,x″i,x″j}能量值小于其他两个个体的能量值,则随机生成rand_pro1∈(0,1),如果rand_pro1≤Ps则将该个体设为优势个体;同理,如果某一个体Y″∈{xi,x″i,x″j}的对应相似度是最小的,则随机生成rand_pro2∈(0,1),如果rand_pro2≤Ps则将该个体设为优势个体;最后,优势个体替代目标个体,更新种群;5)判断是否达到最大迭代代数Gmax,若达到,则输出结果,否则转至步骤4)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710717391.2/,转载请声明来源钻瓜专利网。