[发明专利]一种基于属性约简和XGBoost的COVID-19检测假阴性识别方法在审
申请号: | 202010451499.3 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111834010A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 杨杰;王东;张显;杨泮;刘福禄;庞正刚;胡昌荣 | 申请(专利权)人: | 重庆工贸职业技术学院 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H10/60;G06F16/215 |
代理公司: | 成都明涛智创专利代理有限公司 51289 | 代理人: | 丁国勇 |
地址: | 408000 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 属性 xgboost covid 19 检测 阴性 识别 方法 | ||
1.一种基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,包括如下步骤:
S1、获取COVID-19病例样本数据并进行预处理及数据增强;
S2、对经步骤S1处理后的样本数据进行属性约简,降低数据维度,并将样本数据划分为训练集和测试集;
S3、使用XGBoost提升树可扩展系统对COVID-19检测核心指标进行重要度筛选;
S4、利用训练集中的数据对XGboost算法评估模型进行训练,建立评估模型;并将测试集的数据代入评估模型进行识别诊断,验证评估模型效果;
S5、利用评估模型对病例数据进行预测。
2.根据权利要求1所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述步骤S1中的数据预处理包括:
缺失数据处理:对于数值型缺失数据采用均值法补齐,对于字符型缺失数据采用空白值填充,对于缺失数据大于20个的属性直接删除;非连续数据编码:使用One-Hot对分类字符串进行转换。
3.根据权利要求2所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述S1中的数据增强采用如下方法:对于非平衡数据,通过合成少数类过采样技术方法对少数类样本进行分析,并本根据少数类样本人工合成新样本扩充到原样本数据中。
4.根据权利要求2所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述S1中的数据增强采用如下方法:对于非平衡数据,采用MMD-GAN进行数据增强,生成模拟样本。
5.根据权利要求1所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述步骤S2中采用模糊粗糙集属性约简方法约简数据中属性依赖度较低的属性。
6.根据权利要求1所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述步骤S3中,在进行检测核心指标重要度筛选前,先用MDGO优化XGBoost算法评估模型参数。
7.根据权利要求6所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述步骤S3中的属性重要度筛选包括:提取评估模型所有检测指标的重要度权重,根据平均权重及临床实际对核心指标进行重要度排序。
8.根据权利要求6所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述MDGO优化的XGBoost算法评估模型参数为:学习率0.28,伽玛0.03,最大树深度5,最小叶权重0.25,子采样0.33,列采样率0.16。
9.根据权利要求1所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述S2中训练集与测试集通过5折交叉验证方法按照8:2的比例进行划分。
10.根据权利要求1所述的基于属性约简和XGBoost的COVID-19检测假阴性识别方法,其特征在于,所述步骤S4中测试集验证评估模型效果时,通过准确率、查准率、查全率、综合性指标来评价评估模型效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工贸职业技术学院,未经重庆工贸职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010451499.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种嗜热链球菌及其应用
- 下一篇:一种模切机构的移动装置