[发明专利]一种基于距离相似度的蛋白质构象空间搜索方法有效

专利信息
申请号: 201710717391.2 申请日: 2017-08-21
公开(公告)号: CN107633159B 公开(公告)日: 2020-06-02
发明(设计)人: 张贵军;王小奇;周晓根;王柳静;郝小虎;马来发 申请(专利权)人: 浙江工业大学
主分类号: G16B20/00 分类号: G16B20/00
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于距离相似度的蛋白质构象空间搜索方法,在遗传算法的基本框架下,对每个目标个体完成交叉和变异操作;计算出目标个体残基间的空间距离值,并由这些空间距离值构成目标特征向量;然后,求出目标个体的特征向量与先验知识中目标蛋白的初始特征向量的Manhattan距离;同理,计算得到变异个体对应的变异特征向量以及对应的Manhattan距离;最后,根据Manhattan距离值和能量值选出优势个体,更新种群。本发明提出一种预测精度高、计算代价低的基于距离相似度的蛋白质构象空间搜索方法。
搜索关键词: 一种 基于 距离 相似 蛋白质 构象 空间 搜索 方法
【主权项】:
一种基于距离相似度的蛋白质构象空间搜索方法,其特征在于:所述构象空间搜索方法包括以下步骤:1)给定输入序列信息;2)参数初始化:设置种群规模Pop_size,最大迭代次数Gmax,交叉因子CR,初始种群搜索轨迹长度iteration,交叉片段长度fragment,变异计数器counter,变异计数器的最大计数值counter_max,每个个体xi,i∈{1,2,...,Pop_size}的能量计算选用Rosetta Score3函数即E(xi),温度常数T,序列间隔num,先验知识中目标蛋白残基间的空间距离构成的初始特征向量V={v1,1+num,…,vk,k+num},k∈[1,length‑num],其中vk,k+num是第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离,length为序列长度,选择概率Ps;3)初始化种群:启动Pop_size条Monte Carlo轨迹,每条轨迹搜索iteration次,即生成Pop_size个初始个体;4)对每个目标个体xi,i=1,.2..,Pop_size进行如下操作:4.1)随机选取个体xj,j∈{1,2,...,Pop_size}且j≠i,随机生成rand∈[0,1],若rand≤CR,则对个体xi和xj进行如下操作:4.1.1)随机生成整数begin∈[1,length‑fragment]作为交叉起始点,进而得到交叉区间[begin,end],其中begin+fragment=end为交叉终止点;4.1.2)在交叉区间[begin,end]内依次交换交个体xi和xj相应的扭转角度,生成新个体x′i,x′j;否则x′i=xi,x′j=xj,转至步骤4.2)4.2)对个体x′i,x′j进行如下的变异操作生成变异个体x″i,x″j:4.2.1)对个体x′i进行片段组装,利用Rosetta Score3函数E(xi)分别计算组装前后的能量值Ei和E′j;4.2.2)利用Monte Carlo机制即根据公式P(ΔE)=min{1,e‑ΔE/T}>random判断是否接收该片段的插入,其中random∈[0,1]的随机数,ΔE是个体x′i的在组装前后的能量变化值即ΔE=E′j‑Ei;4.2.3)如果接受则转至步骤4.2.5)否则转至4.2.4);4.2.4)变异计数器counter开始计数;若counter≤counter_max则依次执行步骤4.2.1)、4.2.2)和4.2.3)直到成功变异生成个体x″i为止;否则执行步骤4.2.1)生成变异个体x″i;最后,计数器counter清零;4.2.5)对个体x′j依次执行步骤4.2.1)、4.2.2)和4.2.3),生成变异个体x″j;4.3)根据目标个体xi和变异个体x″i、x″j的能量和距离相似度进行选择,选出优势个体并更新种群,过程如下:4.3.1)依次计算出目标个体xi的第k个残基相应的α原子和第k+num个残基相应的α原子之间的欧式距离进而得出目标特征向量4.3.2)计算目标个体xi的距离相似度其中d(Vxi,V)=Σk=1length-num(vk,k+numxi-vk,k+num);]]>4.3.3)对个体x″i执行步骤4.3.1)得出个体x″i对应的变异特征向量并根据计算出个体x″i相应的距离相似度sim_mutation_1;4.3.4)对个体x″j依次执行步骤4.3.1)得出个体x″j对应的特变异征向量并根据计算出个体x″j对应的距离相似度sim_mutation_2;4.3.5)根据Rosetta Score3函数分别计算出目标个体xi和个体x″i、x″j的能量值分别为energy_object,energy_mutation_1,energy_mutation_2;4.3.6)在个体xi和个体x″i、x″j中,如果某一个体Y∈{xi,x″i,x″j}的能量值和距离相似度均小于其他两个个体的能量值和距离相似度,则该个体为优势个体;如果某一个体Y′∈{xi,x″i,x″j}能量值小于其他两个个体的能量值,则随机生成rand_pro1∈(0,1),如果rand_pro1≤Ps则将该个体设为优势个体;同理,如果某一个体Y″∈{xi,x″i,x″j}的对应相似度是最小的,则随机生成rand_pro2∈(0,1),如果rand_pro2≤Ps则将该个体设为优势个体;最后,优势个体替代目标个体,更新种群;5)判断是否达到最大迭代代数Gmax,若达到,则输出结果,否则转至步骤4)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710717391.2/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top