[发明专利]基于数据非依赖采集质谱的分子组学数据结构的实现方法有效

专利信息
申请号: 202010144110.0 申请日: 2020-03-04
公开(公告)号: CN111370072B 公开(公告)日: 2020-11-17
发明(设计)人: 郭天南;栾钟治;李子青;张芳菲;禹韶阳;臧泽林 申请(专利权)人: 西湖大学
主分类号: G16C20/20 分类号: G16C20/20;G16C20/80;G16C20/70;G01N27/62
代理公司: 无锡市汇诚永信专利代理事务所(普通合伙) 32260 代理人: 张欢勇
地址: 310024 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 依赖 采集 分子 数据结构 实现 方法
【说明书】:

发明涉及生物分子组学质谱数据技术领域,尤其涉及一种基于数据非依赖采集质谱的分子组学数据结构的实现方法,该质谱数据结构是由质谱原始数据生成的DIAT张量数据,具有三个维度的属性,第一维度为循环次数索引,第二维度为碎片离子质荷比,第三维度为碎片离子所对应的前体离子窗口索引。本案所述的DIAT张量数据完整度高,便于读取且读取速度快,DIAT文件大小仅为mzXML文件的几十分之一,通过可视化池化的DIAT文件图像能够对DIA质谱数据直接观察,能够直接使用视觉处理算法对DIAT张量进行分析,避免了需要大计算量抽取离子色谱峰的操作,并且能够直接根据此文件建立临床样品分类的计算机深度学习模型。

技术领域

本发明涉及生物分子组学质谱数据技术领域,尤其涉及一种基于数据非依赖采集质谱的分子组学数据结构的实现方法。

背景技术

基于质谱(即Mass Spectrum,缩写为MS)的组学已经发展了几十年,并已发展出能够利用其在数小时内对复杂生物样品中成千上万种生物分子,进行谱分析的应用。生物分子经过液相色谱(即liquid chromatography,缩写为LC)分离并通过串联质谱(MS/MS)碎片离子谱鉴定和定量,并以此鉴定和定量生物分子,应用包括蛋白质组学,代谢组学和脂质组学。

基于质谱的组学目前有以下几种采集模式:

1.数据依赖性采集(简称DDA):数据依赖型采集依赖于样品的一级谱图中前体离子的强度,按前体离子排序进行二级碎裂具有一定随机性,鉴定重现性较低;

2.靶向监测(简称SRM):目标方法-选定的反应监测虽然可以精确地分析一组预定义分子,但通量只有数百条;

3.数据非依赖性采集(简称DIA):DIA(即Data independent acquisition)是一项全息式数据非依赖性采集定量技术,它将质谱整个全扫描范围分为若干个窗口,高速、循环地对每个窗口中的所有离子进行选择、碎裂及检测,从而无遗漏、无差异地获得样本中所有离子的全部碎片信息,无需指定目标分子,扫描点数均匀,利用谱图库即可实现定性确证和定量离子筛选,并可实现数据回溯。例如:卫星扫描质谱技术(SWATH)将一级质谱分为一系列相邻的25m/z(即25m/z)或更大尺寸的前体离子选择窗口,在每一个窗口中,每个前体离子与所有其他前体离子同时破碎,并同时记录了源自同一窗口的碎片离子的相应多重谱图,落入相同前体离子窗口的碎片离子可以被系统地无偏差记录,克服了DDA模式下前体离子选择的随机性的同时,也保留了目标方法的高准确性。数据非依赖采集的质谱方法可以重复覆盖低丰度的分子,从而可以产生一个永久的数字图谱来代表所有可测量的分子信号,作为生物分子组学的电子档案。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西湖大学,未经西湖大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010144110.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top