[发明专利]基于并行计算的代谢组学数据处理方法有效

专利信息
申请号: 201410382286.4 申请日: 2014-08-06
公开(公告)号: CN104111819A 公开(公告)日: 2014-10-22
发明(设计)人: 孙海涛;杨志强 申请(专利权)人: 山东师范大学
主分类号: G06F9/38 分类号: G06F9/38;G06F9/44
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 张勇
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 并行 计算 代谢 数据处理 方法
【说明书】:

技术领域

发明涉及一种基于并行计算的代谢组学数据处理方法。

背景技术

代谢组学是继基因组学和蛋白质组学之后新发展的生命科学领域的一个分支,通过对生物体内所有代谢物进行定量或定性分析来寻找其与病理变化的相对关系。Nature先后发表了多篇利用代谢组学对人类疾病进行研究的论文。国内外的科研管理部门也发布了关于代谢组学的研究课题。核磁共振光谱(NMR)和色谱-质谱(HPLC-GS或GC-MS)联用是代谢组学研究常用的两种测量手段,每种测量手段都会产生大量的数据,处理、分析这些数据既耗时又具有挑战性,需要专门的数学、统计和信息学工具。

为处理代谢组学实验生成的大量数据,研究者们对数据处理和分析方法进行了大量研究,并开发了一些高效率的数据处理软件。在数据预处理阶段,有根据测量手段进行研究的,如基于NMR的软件开发,液相色谱-质谱数据高性能分析研究等;也有对数据的处理方式进行研究的,如开发单机版的代谢数据处理软件和在多核计算机上对数据并行处理的软件。对数据进行并行处理是提高速度的重要手段,质谱数据处理软件X!Tandem实现并行以后,原来在单核计算机上需要处理20个小时的数据,在40个核的并行环境下,只需要30分钟,速度提高了40倍。

在实验数据处理过程中,发现单机版的代谢组学数据处理软件进行高通量计算需要耗费很长时间;而并行软件又存在着费用高、部署难度大、硬件环境要求高的问题。为克服以上困难,我们将并行计算与成熟的开源数据处理软件MZmine相结合,根据代谢组学数据处理特点,将一个数据处理任务分解为多个小任务交由不同的计算资源进行并行计算,最后将结果合并汇总,既加快了数据处理速度,又从软硬件两方面节约了成本。

发明内容

本发明的目的就是为了解决上述问题,提供一种基于并行计算的代谢组学数据处理方法,它具有将并行计算与成熟的代谢组学处理软件相结合实现数据处理的并行化,在提高处理效率的同时又不影响结果的准确性优点。

为了实现上述目的,本发明采用如下技术方案:

一种基于并行计算的代谢组学数据处理方法,包括如下步骤:

步骤(1):将动物血清样品送入色谱-质谱检测仪,经过色谱-质谱检测仪的处理后,色谱-质谱检测仪输出原始数据,所述原始数据为以样品组分的保留时间为横坐标,以样品组分的峰值浓度为纵坐标的原始谱图;

步骤(2):将并行计算与MZmine软件结合实现数据处理的并行化:将步骤(1)得到的原始谱图,根据原始数据的样品中组成成分的谱峰的数量和样品组分的保留时间来进行任务分解,分解成若干个子任务,为提高并行计算的数据处理速度,任务分解的要求是分解后的每个子任务内谱峰高度满足设定阈值的谱峰数量是大致相等的;将分解后得到的子任务交由若干个均配置有MZmine软件的服务器进行并行计算;计算得到样品包含的物质的成分,进而得到样品组分的数据表格;

步骤(3):数据输出。

所述步骤(2)的MZmine软件提供了对谱图按照样品组分的保留时间进行分段检测的功能,所述分段需要覆盖整个保留时间,同时在计算完成后对保留时间重叠区域的数据进行去重处理。

所述步骤(2)的组分的保留时间是指被分离样品成分从进样开始到出现该组分浓度极大值时的时间。

所述数据表格的列为样品的组成成分,所述数据表格的行为不同的样品名称。

所述步骤(3)中数据输出是指将上述数据表格进行合并汇总,汇总到一个数据表格中。

本发明的有益效果:

1利用并行计算进行代谢组学数据处理是一种粗粒度的并行处理模式,该模式有以下优点:(1)可以按需分配计算资源。在样品的组分检测出来之前,虽然可以预测其组成,但是最终耗时仍需计算决定,所以在固定的保留时间内,由于组分的差别,有的可能需要更多的计算资源,因此可以在计算过程中根据计算进度随时提高计算资源的配置,如增加CPU或内存等;而当一个计算任务完成后,则可以释放计算资源,从而节约能源,实现绿色计算。(2)计算资源的冗余配置确保计算能安全高效进行。在单一计算资源环境下,如果计算资源故障,则需对计算重新开始(或从某个固定的时间点开始),而采用多计算资源并行计算,则只需对故障资源进行替换,重新计算部分数据即可。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410382286.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top