[发明专利]一种基于简约空间抽象凸下界估计的蛋白质构象优化方法在审
申请号: | 201410686664.8 | 申请日: | 2014-11-25 |
公开(公告)号: | CN104732115A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 张贵军;郝小虎;周晓根;程凯;梅珊;俞旭锋;李章维 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于简约空间抽象凸下界估计的蛋白质构象优化方法,包括以下步骤:根据粗粒度能量模型,以Rosetta Score3为优化目标函数,将能量计算模型转换为二面角优化空间能量模型;通过特征向量提取,将高维二面角优化问题转换为实际可操作的笛卡儿空间优化问题;基于Karmarker射影变换,将笛卡儿空间能量模型转换成单位单纯形约束下的非线性优化问题,如此构建抽象凸下界支撑面,并进行更新;结合片段组装和Monte Carlo算法获得一系列亚稳态构象;最后,通过Rosetta服务器提供的Refinement服务获得高分辨率的蛋白质构象。本发明采样效率较高、复杂度较低、预测精度较高。 | ||
搜索关键词: | 一种 基于 简约 空间 抽象 下界 估计 蛋白质 构象 优化 方法 | ||
【主权项】:
一种基于简约空间抽象凸下界估计的蛋白质构象优化方法,其特征在于:所述构象空间优化方法包括以下步骤:1)根据粗粒度能量模型,采用基于知识的Rosetta Score3能量模型作为目标函数,如式(1)所示,并初始化种群:f1=f1(x‾1,x‾2,...,x‾N‾)---(1)]]>其中表示N,C,O和CF原子的总数,表示第i个原子的坐标(x‾1i,x‾2i,x‾3i),i=1,2,...,N‾;]]>2)对1)中的目标函数进行模型转换:2.1)采用坐标变换方法,将计算模型f1转化为二面角优化空间能量模型f2:其中为骨架二面角向量,NRES表示残基个数,φi,ωi分别表示第i个残基中原子C‑N‑Cα‑N,N‑Cα‑C‑N,Cα‑C‑N‑Cα的二面角;2.2)采用超速形状识别方法,提取蛋白质结构的4个特征点,分别是:分子质心CTD,离CTD最近的原子CST,离CTD最远的原子FCT,离FCT最远的原子FTF,通过计算蛋白质分子粗粒度骨架模型中所有原子与四个特征点的平均距离,距离方差,以及距离偏差指标,组成蛋白质结构的12维特征向量M→=(μ1ctd,μ2ctd,μ3ctd,μ1cst,μ2cst,μ3cst,μ1fct,μ2fct,μ3fct,μ1ftf,μ2ftf,μ3ftf),]]>综合考虑精度和复杂度的因素,选择作为蛋白质结构特征坐标,基于模型(1),得到如下特征空间能量模型f3:f3=(M→U)=f3(μ1ctd,μ1cst,μ1fct,μ1ftf)---(3)]]>其中表示蛋白质粗粒度骨架模型中所有原子与特征点CTD,CST,FCT,FTF的平均距离;2.3)基于Karmarker摄影变换,将模型(3)转换为单位单纯形S约束下的非线性优化问题f4:f4(x′)≡f4(x1′,x2′,x3′,x4′,x5′),s.t.xi′≥0,Σi=15x′=1,i=1,2,3,4,5---(4)]]>2.4)针对f4,采用严格递增射凸函数变换方法,在目标函数项增加一个正常数,将其转换为单位单纯形约束下的严格递增射凸函数f5(x′);2.5)对于K个采样点,针对第i个采样点x′i,计算其抽象凸次微分,构建f5(x′)在采样点x′i处的支撑弱函数h(x′i):h(x′i)=f5(x′i)min{x1′x1′i,...,xK+1′xK+1′i}---(5)]]>2.6)建立max‑min分段线性能量模型f6(x′):f6(x′)=maxh(x′i),i=1,2,…,K (6)2.7)考虑K+1维支撑向量矩阵L:其中li=(f(x′i)x1′i,f(x′i)x2′i,...,f(x′i)xK+1′i)]]>为支撑向量;2.8)建立N叉树来保存下界估计信息;3)构建简约空间低估模型:3.1)对初始种群中的每个构象建立支撑向量;3.2)找出N叉树中不满足条件的叶子节点,用构建的支撑向量替换;3.3)判断替换后的节点是否满足满足,则保留这个节点,不满足,则删除;4)执行搜索过程:4.1)设置终止条件;4.2)在种群中随机选出两个不同的个体;4.3)通过交叉变异产生新的个体:随机选择所选父代个体中相同长度的片段进行交换,再对其做片段组装,生成新的个体;4.4)判断新生成的个体落在哪一个搜索区域;4.5)计算其下界估计值E′C;4.6)计算E′C与所选父代个体中能量值较小的个体的能量值的差值δ1,如果δ1>0,则跳出本次计算,若δ1<0,计算其真实能量EC;4.7)计算EC与所选父代个体中能量值较小的个体的能量值的差值δ2,若δ2<0,则用其替换种群中所选父代能量值较高的个体;5)判断是否满足终止条件,如否,转4.2);如是,则结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;,未经浙江工业大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410686664.8/,转载请声明来源钻瓜专利网。
- 上一篇:加密信息的显示方法及终端
- 下一篇:用于设计生物模型的计算机实现的方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用