[发明专利]基于混合并行方式的蛋白质热力学分析高效随机模拟方法有效
申请号: | 201310683507.7 | 申请日: | 2013-12-12 |
公开(公告)号: | CN103729577B | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 彭丰斌;魏彦杰;张慧玲;弓英瑛 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙)44316 | 代理人: | 沈祖锋,郝明琴 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混合 并行 方式 蛋白质 热力学 分析 高效 随机 模拟 方法 | ||
【技术领域】
本发明涉及生物信息分析技术领域,特别是涉及一种基于混合并行方式的蛋白质热力学分析高效随机模拟方法。
【背景技术】
蛋白质折叠主要研究蛋白质如何在短时间内从一维多肽链折叠为天然三维结构,形成具有生命功能的大分子。生物体的遗传信息(DNA)通过RNA转录和翻译过程传递给蛋白质(即中心法则),因此蛋白质折叠也被称为第二遗传密码,它的研究可以帮助揭示生命遗传信息的表达和功能传递的奥秘。在从一维多肽链到天然三维结构的折叠过程中,蛋白质可发生误折叠或聚集,其结构和功能因此受到破坏,从而引起‘折叠病’,比如老年痴呆症等。因此蛋白质折叠研究对探索多种‘折叠病’机理意义重大。
目前,研究蛋白质折叠的算法大多数都在分子动力学模拟和随机模拟中实现。一般而言,分子动力学模拟常用于研究蛋白质系统的动力学过程;而随机模拟则可以研究蛋白质系统的整个热动力学过程。针对使用高精确度的全原子蛋白质模型的模拟,需要计算成千上万个原子之间的多种相互作用力,对于分子动力学模拟只能模拟纳秒级的蛋白质折叠过程,故其在微秒到毫秒时间内的蛋白质折叠研究中具有很大的局限性;此外,分子动力学模拟也受一个初始实验构型的影响。而随机模拟不但能用于微秒到毫秒时间内的蛋白质折叠研究,而且不依赖于一个具体的初始构型,可以更广泛地搜索构型空间。
经典的WangLandau算法就是随机模拟领域最吸引人最有发展情景的新算法,它能解决生物信息学、统计物理学等多个领域的很多复杂问题。比如在蛋白质折叠研究中,该算法有两个最显著的优点:第一,蛋白质模拟不会局限在局部最小能量状态,因而能较好地在整个能量区间进行自由行走;第二,通过该算法可模拟和计算出蛋白质系统态密度,因而就能进一步求解得到宽广温度范围内的很多热动力学量如比热等,这样就能高效地分析和研究蛋白质折叠的整个热力学过程。但WangLandau算法在计算精度和速度上还有待于进一步提升。
鉴于此,克服该现有技术所存在的缺陷是本技术领域亟待解决的问题。
【发明内容】
本发明要解决的技术问题是提供一种基于混合并行方式的蛋白质热力学分析高效随机模拟方法。
本发明采用如下技术方案:
一种基于混合并行方式的蛋白质热力学分析高效随机模拟方法,包括:
步骤A:确定蛋白质能量模型和能量区间;
步骤B:确定所述蛋白质能量区间的分段方式;
步骤C:模拟及计算蛋白质系统态密度。
进一步地,所述步骤A进一步包括:
采用ECEPP蛋白质能量模型,ECEPP能量力场的表达形式为:
EECEPP=EC+ELJ+EHB+ETor
其中,是两电荷之间的库伦作用力,rij表示原子i和j之间的距离;是两原子之间的兰纳-琼斯作用力;是氢键作用力;ETor=∑lUl(1±cos(nlξl))是两面角旋转作用力,ξl是第l个两面角。
进一步地,所述步骤A进一步包括:
对所使用的蛋白质能量区间进行离散化处理,若取k个能量bin区间值,则对[Emin,Emax]平均划分k个bin区间,用每个bin区间中间的一个能量值代表能量区间值。
进一步地,所述步骤B进一步包括:
步骤B1:对能量区间平均分为M段,设相邻子能量区间之间的重合度等于Δ个bin区间,则每一段含有个bin区间;
步骤B2:依照当前计算得到的蛋白质系统态密度函数的对数S(E)分布特点,自适应地对能量区间分段,若某个子能量区间为[Ebegin,Eend],则
进一步地,所述步骤C进一步包括:
通过MPI的主从进程模式和OpenMP的多线程并行模式,模拟及计算蛋白质系统态密度。
进一步地,在所述主从进程模式的N个分进程中,分进程1为主进程,其余分进程均为子进程。
进一步地,所述主进程包括如下步骤:
步骤S11:初始化蛋白质系统态密度函数的对数S(E)=lng(E)=0,直方图H(E)=0(Emin≤E≤Emax),修正因子df=1(=lnf=lne);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310683507.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:保护元件及电子设备
- 下一篇:层叠陶瓷电容器以及其制造方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用