[发明专利]一种代谢混合物MS/MS质谱的仿真生成方法及系统有效
申请号: | 201610049964.4 | 申请日: | 2016-01-25 |
公开(公告)号: | CN105760708B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 周家锐;纪震;殷夫;朱泽轩 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F19/12 | 分类号: | G06F19/12 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 代谢 混合物 ms 仿真 生成 方法 系统 | ||
本发明公开一种代谢混合物MS/MS质谱的仿真生成方法及系统。本发明不依赖于真实实验,可通过修改参数设定,大量产生所需的代谢混合物MS/MS仿真质谱,其成本极低,样本量不受采集条件限制。此外,当条件与环境变动时,也无需重新设计并进行实验;有助于提升代谢组学的研发效率。本发明使用非线性回归模型生成MS/MS仿真质谱,避免了传统算法中简单线性叠加所带来的准确性问题。此外,通过统计真实代谢质谱数据建立噪声概率模型,涵盖了现实应用中需要面临的复杂干扰情况。所生成的质谱数据更符合实际,可有效指导代谢组学的前期研发,并部分用于算法性能的验证。
技术领域
本发明涉及仿真领域,尤其涉及一种代谢混合物MS/MS质谱的仿真生成方法及系统。
背景技术
代谢物是生物体内完成代谢过程的小分子有机化合物总称,其包含了丰富的生理状态信息。代谢组学基于对代谢物的整体系统性研究,可有效揭示生理现象背后的真实机理,并更为全面地展示生命体的动态状态,因此获得了越来越多的重视,被广泛应用于诸多科研与实用领域中。质谱分析(Mass Spectrometry,MS)是代谢组学最为重要的研究工具之一。其中的二级质谱(MS/MS)因其可有效鉴别不同代谢物质,并准确衡量信号强度,近年来已成为主要的发展方向,其数据形式如图1和图2所示。在实际应用中,一般需分析包含多种代谢物的混合物质,其MS/MS质谱成为相关研究与开发的数据基础。
现有的代谢混合物MS/MS质谱主要由两种方法获得:
第一种是直接通过实际实验,使用质谱仪取得特定混合物样本的MS/MS质谱,这一方法可得到真实的谱线数据,是代谢组学最为重要的信息来源与支撑。但其成本较高,在不同混合物与参数条件下的质谱差异较大,难以满足相关研究的需求。
第二种是使用计算机仿真技术,根据已知的单一代谢物MS/MS质谱及理化知识,生成推定的谱数据(Putative Spectra)。此方法成本较低,可大量产生特定参数条件下的代谢混合物仿真质谱。但准确度不高,用于研究开发可能导致错误结果。
在现有的代谢组学研究中,一般使用计算机仿真所生成的MS/MS质谱数据进行初期研发,而后再基于实验数据验证其真实性能。仿真质谱的准确程度决定了相关研究的质量与速度。
现有基于实验的代谢混合物MS/MS质谱生成方法,其缺点在于:
第一,混合物中的各种化学分子在进行二级质谱分析时会相互影响,所产生的MS/MS数据并非各单一物质谱线的简单叠加。且质谱仪参数设置不同,谱线分布也会有所差异。因此实验数据往往难以重复利用,需针对特定的研发项目,重新设计并采集所有的质谱信息,所需成本极高。
第二,某些特定的代谢混合物,例如糖尿病人的血液样本等,采集难度较大、成本较高。且在每个个体上仅能获得有限的样本量,其总数难以保证。影响了后续研究的进行。
现有基于计算机仿真的混合物MS/MS质谱生成方法,其缺点在于:
第一,现有算法往往基于各单一代谢物质谱的线性叠加,与实际情况中的非线性混合状况差异较大。当用于代谢组学研究时,容易导致模型过于简化。在真实的混合物MS/MS质谱上的分析性能不佳。
第二,现有方法所使用的噪声模型过于简单,一般为与生物信息无关的高斯噪声或编辑误差等,所生成的MS/MS仿真质谱难以反映实际情况。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种代谢混合物MS/MS质谱的仿真生成方法及系统,旨在解决现有的代谢混合物MS/MS质谱生成方法要么成本高、采集难度大、要么分析性能不佳、误差大等问题。
本发明的技术方案如下:
一种代谢混合物MS/MS质谱的仿真生成方法,其中,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610049964.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用