[发明专利]基于IM-DIAT数据结构的应用方法及其应用在审

专利信息
申请号: 202111243593.0 申请日: 2021-10-25
公开(公告)号: CN113990387A 公开(公告)日: 2022-01-28
发明(设计)人: 郭天南;张芳菲;胡一凡 申请(专利权)人: 西湖实验室(生命科学和生物医学浙江省实验室)
主分类号: G16B20/00 分类号: G16B20/00;G16B50/00;G06N3/04;G06N3/08
代理公司: 无锡市汇诚永信专利代理事务所(普通合伙) 32260 代理人: 倪杨
地址: 310024 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 im diat 数据结构 应用 方法 及其
【说明书】:

发明涉及基于IM‑DIAT数据结构的应用方法及其应用,该方案包括以下步骤:提取质谱原始文件中质谱信息的必要属性;将该必要属性转换计算得到窗口索引、循环索引、离子淌度及质荷比,并分别与信号峰度一一对应作为IM‑DIAT数据结构的四个维度形成IM‑DIAT数据结构;将所述IM‑DIAT数据结构经过图像处理转换为深度学习能够利用的二维多通道图像数据;将所述二维多通道图像数据作为深度学习的训练数据得到分类结果。本申请能够适合dia‑PASEF这种新型的采集方式,而且可以保留离子淌度信息,将DIAT数据格式化,结构化为类图像数据,从而能用深度学习技术有效处理这些数据,解决了甲状腺良恶性的判别问题。

技术领域

本发明涉及非依赖性采集质谱的蛋白质组学技术领域,具体涉及基于IM-DIAT数据结构的应用方法及其应用。

背景技术

结合多种分离方法的数据依赖采集(Data-dependent acquisition,DDA)是临床样本等复杂样本最广泛采用的基于质谱的蛋白质组学策略。与DDA相比,DIA通过前体口窗的顺序分离和碎片化,获得所有可能前体的所有片段模式(MS2),克服了DDA对前体离子随机选择的问题,实现了高蛋白覆盖率和高复制的优点。

在捕获离子迁移谱仪(timsTOF Pro)中实现的dia-PASEF通过平行积累-串联碎片(PASEF)的质量和离子迁移率的相关性,允许肽段前体离子几乎100%的传输。这大大降低了数据独立采集(DIA)的光谱复杂性,并提高了蛋白鉴定的敏感性和特异性,通过添加第四维从四极杆质谱仪分离选择的离子迁移率可以通过PASEF同步扫描,与仅限于1-3%的离子采样效率典型DIA方法相比,进一步将四极杆质谱仪的离子采样效率提高到100%,这从本质上提高了采集的灵敏度。但是相关软件工具尚未完全支持这种新兴的新型数据。

而且传统方法需要先进行搜库,然后在搜库结果上进行数据处理,这样的缺点有二:提取离子色谱峰(XIC)需要大量计算且依赖于库的肽段数量,需识别DIA-MS数据中的肽前体,而往往存在大量缺失值使搜库结果矩阵存在大量缺失值。

因此提出了如CN111370072B-基于数据非依赖采集质谱的分子组学数据结构的实现方法,可通过深度学习算法可以直接分析DIAT张量,避免了提取离子色谱峰(XIC)需要大量计算的问题。最后,根据该格式文件可以直接建立临床样本分类的深度学习模型。该方法使用端到端深度学习框架构建从原始MS数据到诊断分类器的函数映射,无需识别DIA-MS数据中的肽前体,从而避免了缺失值的问题,但是这种方法不适合dia-PASEF这种新型的采集方式,而且重要的离子淌度信息没有被保留下来,因此亟待一种基于IM-DIAT数据结构的应用方法及其应用。

发明内容

本发明的目的是针对现有技术中存在的上述问题,提供了基于IM-DIAT数据结构的应用方法及其应用。

为了实现上述发明目的,本发明采用了以下技术方案:基于IM-DIAT数据结构的应用方法包括以下步骤:

提取质谱原始文件中质谱信息的必要属性;

将该必要属性转换计算得到窗口索引、循环索引、离子淌度及质荷比,并分别与信号峰度一一对应作为IM-DIAT数据结构的四个维度形成IM-DIAT数据结构;

将所述IM-DIAT数据结构经过图像处理转换为深度学习能够利用的二维多通道图像数据;

将所述二维多通道图像数据作为深度学习的训练数据得到分类结果。

工作原理及有益效果:1、与现有技术相比,本申请能够从质谱原始文件中提取并经过计算得到具有四个维度的IM-DIAT数据结构,其中由于增加了离子迁移率,能够让质荷比维度不能区分的肽段离子在新增的离子迁移率(离子淌度)的维度上分离,也就是通过添加第四维从四极杆质谱仪分离选择的离子迁移率可以通过PASEF同步扫描,与仅限于1-3%的离子采样效率典型DIA方法相比,进一步将四极杆质谱仪的离子采样效率提高到100%。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西湖实验室(生命科学和生物医学浙江省实验室),未经西湖实验室(生命科学和生物医学浙江省实验室)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111243593.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top