[发明专利]一种基于呼出气体标志物检测的健康状态识别方法在审
申请号: | 202110926446.7 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113628741A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 黄忠辉;谢丹平;聂鹏;刘旺;贺辉;杨迪;黄钟坤;康同曦;蒋炜玮 | 申请(专利权)人: | 生态环境部华南环境科学研究所 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30;G06K9/62 |
代理公司: | 广东省畅欣知识产权代理事务所(普通合伙) 44631 | 代理人: | 耿佳 |
地址: | 510655 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 呼出 气体 标志 检测 健康 状态 识别 方法 | ||
1.一种基于呼出气体标志物检测的健康状态识别方法,其特征在于:识别方法的步骤为:
S1:与测量仪器通信获得测量样本因子;
S2:对测量样本因子进行标准化处理;
S3:结合历史数据,采用随机森林决策树的深度调整算法进行训练,得出特征因子和疾病程度的最优算法模型;
S4:采用该最优算法模型判定算法模型训练效果是否达到设定阈值,是则对测量样本进行实时快速预测,否则回到S3步骤中重新进行模型训练;
S5:测量样本预测后进行结果输出。
2.根据权利要求1所述的一种基于呼出气体标志物检测的健康状态识别方法,其特征在于:S1步骤中测量仪器是可以快速准确测定人体呼出气中挥发性有机物浓度的检测设备。
3.根据权利要求2所述的一种基于呼出气体标志物检测的健康状态识别方法,其特征在于:S2步骤中测量样本因子标准化是仪器能检出的所有VOCs浓度进行归一化处理(x-min)/(max-min),使所有特征因子的数值范围转化为[0-1],对已经诊断的疾病分类进行6个one-hot标签独热编码,极重度COPD对应标签为1,重度COPD对应标签为2,中度COPD对应标签为3,轻度COPD对应标签为4,肺部炎症对应标签为5,健康者对应标签为0,且疾病状态分为健康、肺部炎症、Ⅰ级(轻度)COPD、Ⅱ级(中度)COPD、Ⅲ级(重度)COPD和Ⅳ级(极重度)COPD等六种。
4.根据权利要求3所述的一种基于呼出气体标志物检测的健康状态识别方法,其特征在于:S3步骤中最优算法模型中采用最优化算法思想,不停地迭代训练使误差最小化。
5.根据权利要求4所述的一种基于呼出气体标志物检测的健康状态识别方法,其特征在于:S3步骤中随机森林就是由若干个决策树组成的集成分类器;每个决策树随机的选择样本属性进行预测,最后得到结果,整个决策树组成的森林可以进行投票,最后将样本属于六个类别中得票最高的一个类别作为最终预测结果;随机森林是一个并行式集成学习方法,其是以决策树为单学习器构建并行集成的基础上,进一步在决策树的训练过程中引入了随机属性和随机树选择;且决策树是一种对样本特征按照信息增益大小排序,然后分别对每个属性进行分类的单分类器;
信息增益(Gain)表示信息熵(Ent)的变化:
其中,样本集合D中第k类样本所占的比例为pk,离散属性a有V个可能取值,若使用a来对样本集D进行划分,则会产生V个分支节点,其中第v个分支节点包含了D中所有在属性a上取值为av的样本,记为Dv;由上公式可以计算出信息熵和信息增益。
6.根据权利要求5所述的一种基于呼出气体标志物检测的健康状态识别方法,其特征在于:S3和S4步骤中训练算法模型是指将历史数据随机拆分为不均等两份,多的部分数据作为训练集,少的为测试集,可以迭代训练出接近最优模型的新模型,从而用该模型对新的病患样本进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生态环境部华南环境科学研究所,未经生态环境部华南环境科学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110926446.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:放线滑车引导臂装置
- 下一篇:一种磷肥及其制备方法