[发明专利]一种基于拟靶向代谢组学深度指纹实现细菌分类与鉴定的方法在审
申请号: | 202110997102.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113744808A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 吴清平;冯颖;丁郁;韦献虎;张友雄;陈谋通;张菊梅;杨小娟;陈玲;代京莎;杨宁;陈惠元 | 申请(专利权)人: | 广东省科学院微生物研究所(广东省微生物分析检测中心) |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B50/00;G06T7/13;G06T7/00;G06N3/08;G06N3/04;G06K9/62;G01N30/86 |
代理公司: | 广州科粤专利商标代理有限公司 44001 | 代理人: | 刘明星;朱聪聪 |
地址: | 510070 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 靶向 代谢 深度 指纹 实现 细菌 分类 鉴定 方法 | ||
1.一种基于拟靶向代谢组学轮廓和深度学习实现细菌分类与鉴定的方法,其特征在于,对待鉴别的样品进行前处理,对处理后的样品进行代谢轮廓的采集,采集的数据经过归一化处理后,利用处理后的图谱进行细菌的鉴别。
2.根据权利要求1所述的方法,其特征在于,具体步骤如下:
1)样品前处理;
2)拟靶向方法的建立
使用高分辨质谱采集质量控制(QC)样品的一级和二级信息,经处理后,导出代谢物的母离子和子离子列表,生成具有SRM或者MRM通道的超高效液相色谱/三重四级杆质谱采集方法;质量控制(QC)样品是通过混合所有样品的等份上清液来制备的;
3)代谢轮廓的收集
用建立的超高效液相色谱/三重四级杆质谱采集方法进行实际待测样本的高覆盖代谢组学分析采集代谢轮廓质谱图谱;
4)代谢轮廓图谱的预处理
对质谱数据进行峰的检测、提取、对齐和积分后进行缺失值的填充和归一化处理后进行后续的数据分析;
5)细菌的鉴别
通过机器学习算法对已知分类的代谢轮廓图谱数据进行训练,建立细菌鉴定数据库,将新的数据代入库中进行测试鉴定。
3.根据权利要求2所述的方法,其特征在于,步骤1)的样品前处理是将生长至OD600值达到0.6±0.05的菌液或者临床感染标本,离心收集,冷PBS溶液洗涤两次后,液氮淬灭代谢反应,加入冷提取液超声破碎后,收集上清液用于LC/MS分析,所述的冷提取液包括按体积比乙腈:甲醇:水=2:2:1,含同位素标记内标混合物;质量控制(QC)样品是通过混合所有样品的等份上清液来制备的。
4.根据权利要求2所述的方法,其特征在于,步骤2)中,所述的高分辨质谱包括TOF,Orbitrap,FT-ICR-MS。
5.根据权利要求2所述的方法,其特征在于,步骤2)中,超高效液相色谱/三重四级杆质谱采集方法包括MRM、SRM。
6.根据权利要求2所述的方法,其特征在于,步骤3)中,采集时间共12min。
7.根据权利要求2所述的方法,其特征在于,步骤3)中,流动相条件:0~1.0min,1%B;1.0~8.0min,1%~99%B;8.0~10.0min,99%B;10.0~10.1min,99%~1%B;10.1~12min,1%B,其中流动相A为0.1%甲酸水溶液,流动相B可以为乙腈或甲醇。
8.根据权利要求2所述的方法,其特征在于,步骤4)中,数据的缺失值填充方法包括选取某个固定值/默认值填充缺失值,填充均值,填充中位数,填充众数,填充KNN数据,填充模型预测的值。
9.根据权利要求2所述的方法,其特征在于,步骤4)中,数据的归一化包括内标归一、QC归一、四分位归一、log转换、Auto scaling、Pareto scaling等方法中的一种或者多种。
10.根据权利要求2所述的方法,其特征在于,步骤5)中,机器学习算法包括PCA-DFA、PCA-SVM、CNN(ResNet、DenseNet)、VAE-CNN、VAE-ANN。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省科学院微生物研究所(广东省微生物分析检测中心),未经广东省科学院微生物研究所(广东省微生物分析检测中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110997102.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种探测器信号采集系统
- 下一篇:一种诱导死亡的重组细胞及其应用