[发明专利]基于混合并行方式的蛋白质热力学分析高效随机模拟方法有效
申请号: | 201310683507.7 | 申请日: | 2013-12-12 |
公开(公告)号: | CN103729577B | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 彭丰斌;魏彦杰;张慧玲;弓英瑛 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙)44316 | 代理人: | 沈祖锋,郝明琴 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及生物信息分析技术领域,提供了一种基于混合并行方式的蛋白质热力学分析高效随机模拟方法,包括步骤A确定蛋白质能量模型和能量区间;步骤B确定所述蛋白质能量区间的分段方式;步骤C模拟及计算蛋白质系统态密度。采用本发明提供的方法,可以高效地分析和研究蛋白质折叠的整个热力学过程,进而对蛋白质折叠过程进行探索和研究。 | ||
搜索关键词: | 基于 混合 并行 方式 蛋白质 热力学 分析 高效 随机 模拟 方法 | ||
【主权项】:
一种基于混合并行方式的蛋白质热力学分析高效随机模拟方法,其特征在于,包括:步骤A:确定蛋白质能量模型和能量区间;步骤B:确定所述蛋白质能量区间的分段方式;步骤C:模拟及计算蛋白质系统态密度;所述步骤A进一步包括:采用ECEPP蛋白质能量模型,ECEPP能量力场的表达形式为:EECEPP=EC+ELJ+EHB+ETor其中,是两电荷之间的库伦作用力,rij表示原子i和j之间的距离;是两原子之间的兰纳‑琼斯作用力;是氢键作用力;ETor=∑lUl(1±cos(nlξl))是两面角旋转作用力,ξl是第l个两面角;所述步骤A进一步包括:对所使用的蛋白质能量区间进行离散化处理,若取k个能量bin区间值,则对[Emin,Emax]平均划分k个bin区间,用每个bin区间中间的一个能量值代表能量区间值;所述步骤B进一步包括:步骤B1:对能量区间平均分为M段,设相邻子能量区间之间的重合度等于Δ个bin区间,则每一段含有个bin区间;步骤B2:依照当前计算得到的蛋白质系统态密度函数的对数S(E)分布特点,自适应地对能量区间分段,若某个子能量区间为[Ebegin,Eend],则所述步骤C进一步包括:通过MPI的主从进程模式和OpenMP的多线程并行模式,模拟及计算蛋白质系统态密度;在所述主从进程模式的N个分进程中,分进程1为主进程,其余分进程均为从进程;所述主进程包括如下步骤:步骤S11:初始化蛋白质系统态密度函数的对数S(E)=lng(E)=0,直方图H(E)=0,Emin≤E≤Emax,修正因子df=In(f),定义因子f,则修正因子df定义为f的自然对数,并初始化df=1;步骤S12:s=1;步骤S13:依照所确定的蛋白质能量区间的分段方式将能量区间Emin≤E≤Emax分成M段,并分配到M个分线程中,t=1;步骤S14:在每个分线程中,对原来的构型限制在相应的子能量区间里进行随机变动,产生新的构型,计算能量Enew,根据Metropolis准则确定新构型被接受的概率,t=t+1;所述步骤S14循环tmax次;步骤S15:所有线程间相互通信,综合得到整个区间的S(E)和H(E),s=s+1;所述步骤S14和S15循环smax次;步骤S16:所有进程间相互通信,主进程收集所有从进程的Stmp(E)和Htmp(E)并累加计算出全局的S(E)和H(E),即全局的S(E)=S(E)+所有从进程的Stmp(E),全局的H(E)=H(E)+所有从进程的Htmp(E),将全局的S(E)和H(E)广播给所有从进程,判断直方图平缓条件:max(H(E))-min(H(E))max(H(E))+min(H(E))<φ,0<φ<1]]>若不满足则返回执行步骤S12继续迭代;若满足则执行步骤S17;步骤S17:改变修正因子df,再返回执行步骤S12继续迭代,直到满足进程终止条件其中求得S(E),得到蛋白质系统相对的态密度g(E)=eS(E)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310683507.7/,转载请声明来源钻瓜专利网。
- 上一篇:保护元件及电子设备
- 下一篇:层叠陶瓷电容器以及其制造方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用