[发明专利]基于代谢组学的生理预测方法、装置、计算机设备和介质在审
申请号: | 202011453774.1 | 申请日: | 2020-12-12 |
公开(公告)号: | CN114624316A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 吴思;谭国斌;麦泽彬;张健锋;黄福桂;李文锋;吴日伟;牛红志 | 申请(专利权)人: | 广州禾信仪器股份有限公司;昆山禾信质谱技术有限公司 |
主分类号: | G01N27/62 | 分类号: | G01N27/62;G06F17/18;G06K9/62;G06N3/04 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 王程 |
地址: | 510535 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 代谢 生理 预测 方法 装置 计算机 设备 介质 | ||
本申请涉及一种基于代谢组学的生理预测方法、装置、计算机设备和存储介质。采用本申请能够根据呼气样本中的特定成分对特定生理状态进行预测,提高了生理状态判别结果的可靠性,为生理阶段及类型的判别提供实验基础,也为特定生理状态的预测和判别研究提供理论支持。该方法包括:通过获取待检测呼气样本的质谱检测数据,通过预先构建的多元统计分析模型针对上述质谱检测数据进行生理预测,得到各个预测类别的概率值;根据各个所述预测类别的概率值确定上述待检测呼气样本对应的生理预测结果。
技术领域
本申请涉及数据分析技术领域,特别是涉及一种基于代谢组学的生理预测方法、装置、计算机设备和存储介质。
背景技术
人体呼气中含有约200余种挥发性有机化合物(Volatile Organic Compounds,VOCs),随着生理状态的变化,呼气中VOCs的成分会发生变化,呼气成分分析即通过检查呼气中VOCs成分的变化反映机体的生理状态。
现阶段应用于生理状态检测的呼气检测分析方法中使用的数据挖掘技术尚不完善,涵盖的分析方法较为单一,进而导致生理状态检测结果缺乏可靠性。
发明内容
基于此,有必要针对上述技术问题,提供一种基于代谢组学的生理预测方法、装置、计算机设备和存储介质。
一种基于代谢组学的生理预测方法,所述方法包括:
获取待检测呼气样本的质谱检测数据;
通过预先构建的多元统计分析模型针对所述质谱检测数据进行生理预测,得到各个预测类别的概率值;
根据各个所述预测类别的概率值确定所述待检测呼气样本对应的生理预测结果。
在其中一个实施例中,所述预先构建的多元统计分析模型是基于主成分分析模型、正交偏最小二乘法判别分析模型和人工神经网络模型耦合得到的,所述通过预先构建的多元统计分析模型针对所述质谱检测数据进行生理预测,得到各个预测类别的概率值,包括:
通过所述主成分分析模型针对所述质谱检测数据进行降维处理,得到降维后的质谱检测数据;
通过所述正交偏最小二乘法判别分析模型针对所述降维后的质谱检测数据进行回归分析,得到每种代谢物的变量重要性投影值;
根据所述每种代谢物的变量重要性投影值通过训练好的人工神经网络模型进行预测识别,得到各个所述预测类别的概率值。
在一个实施例中,所述获取待检测呼气样本的质谱检测数据之后,还包括:
通过预设的规则针对所述质谱检测数据的缺失值进行数据筛除,得到第一质谱检测数据;
通过预设的填补法针对所述第一质谱检测数据的缺失值进行填补,得到第二质谱检测数据;
通过Z标准化方法针对所述第二质谱检测数据进行标准化处理,得到预处理后的质谱检测数据。
在一个实施例中,所述方法还包括:
获取训练集呼气样本的质谱检测数据;所述训练集呼气样本的质谱检测数据对应有生理真实类别;
利用所述训练集呼气样本的质谱检测数据对所述多元统计分析模型进行训练,得到所述预先构建的多元统计分析模型。
在一个实施例中,所述方法还包括:
依次通过单变量分析方法和多变量分析方法针对质谱检测数据进行筛选,得到满足预设条件的变量;
将所述满足预设条件的变量对应的差异质荷比输入预设的第一代谢通路数据库进行检索定性,得到第一数量的差异标志物;
将所述第一数量的差异标志物输入预设的第二代谢通路分析数据库进行通路分析,得到生理代谢途径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州禾信仪器股份有限公司;昆山禾信质谱技术有限公司,未经广州禾信仪器股份有限公司;昆山禾信质谱技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011453774.1/2.html,转载请声明来源钻瓜专利网。