[发明专利]一种二阶代谢质谱多化合物检测方法、存储介质及服务器有效
申请号: | 201810678473.5 | 申请日: | 2018-06-27 |
公开(公告)号: | CN108846254B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 殷夫;周家锐;朱泽轩;何山 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G16C20/80 | 分类号: | G16C20/80;G16C20/70 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 代谢 质谱多 化合物 检测 方法 存储 介质 服务器 | ||
本发明公开一种二阶代谢质谱多化合物检测方法、存储介质及服务器,方法包括步骤:以现有的二阶代谢质谱数据库为基础,通过对每个化合物二阶质谱数据进行构建可视化网络操作;当输入多化合物谱时,将数据库中每一个化合物的质核比(m/z)范围作为各自在多化合物谱上的搜索范围,再将此范围内的质谱进行构建可视化网络操作;将此搜索范围内化合物谱上的可视化网络与数据库上的单化合物谱可视化网络进行最大子图同构判断,将得到的相似度作为检测模型判定各自的化合物类别。本发明不仅有效解决了其它网络匹配算法需要大量人工干预的缺点,而且降低了处理难度与成本,显著提升了多化合物的检测速度与精度。
技术领域
本发明涉及化合物检测领域,尤其涉及一种二阶代谢质谱多化合物检测方法、存储介质及服务器。
背景技术
代谢物是生物体内完成代谢过程的小分子有机化合物总称,包含了丰富的生理状态信息。代谢组学基于对代谢物的整体系统性研究,可有效揭示生理现象背后的真实机理,并更为全面地展示生命体的动态状态。因此获得了越来越多的重视,被广泛应用于诸多科研与实用领域中。质谱分析(Mass Spectrometry,MS)是代谢组学最为重要的研究工具之一,其中的二阶质谱可有效鉴别不同的代谢物质,并准确衡量其相对浓度,数据形式如图1所示。
现有的代谢多化合物匹配方法大多基于一阶代谢质谱数据,使用的检测方法多为质谱树的形式。其中选取哪一条谱线进行质谱树操作,往往由实验人员人工完成,之后通过质谱树的结构来对化合物进行判定,通常以代谢化合物质谱数据库为基础,通过比较每个谱的M/Z值和相对浓度来进行化合物的鉴点。常用的代谢化合物质谱数据库包括小分子代谢途径数据库(SMPDB)、人类代谢物数据库(HMDB)等。
传统的质谱树检测方法极度依赖测试人员的先验知识,如果不考虑先验知识,将每个多化合物谱中的谱线都进行质谱树操作的话,计算量会十分复杂,难以应用到实际的智能注释检测代谢物的工作中,且传统的匹配算法往往难以应对代谢组学特征高维度、小样本、高噪声的数据特点。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种二阶代谢质谱多化合物检测方法、存储介质及服务器,旨在解决现有代谢多化合物的检测,人工干预程度大、检测结果精度较差以及检测效率较低的问题。
本发明的技术方案如下:
一种二阶代谢质谱多化合物检测方法,其中,包括步骤:
从二阶代谢质谱数据库中获取数据库训练样本数据集S={S1,S2,…,Sn},其中,任意代谢质谱样本Sn=[(m1,i1),(m2,i2),…,(mn,in)],所述(mn,in)表示为第n条谱线的质核比与强度数值;
对所述数据库训练样本数据集S中的每个代谢质谱样本进行优化处理,获得新的样本数据集T={T1,T2,…,Tn};
以样本Tn中的每一条谱线作为可视化网络中的节点,对所述新的样本数据集T中的每一个样本Tn进行可视化操作,构建可视化网络Gn,并获得数据库可视化网络数据集G={G1,G2,......Gn}以及相对应的搜索范围R={R1,R2,......Rn};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810678473.5/2.html,转载请声明来源钻瓜专利网。