[发明专利]一种新冠肺炎轻重症预测模型的构建方法及其应用有效
申请号: | 202111332027.7 | 申请日: | 2021-11-11 |
公开(公告)号: | CN114093523B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 李杰;李鑫;埃德温·王;王亚东 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G16H50/80 | 分类号: | G16H50/80;G16H50/20;G06Q10/04;A61B5/00 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 邓宇 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 肺炎 重症 预测 模型 构建 方法 及其 应用 | ||
1.一种新冠肺炎轻重症预测模型的构建方法,其特征在于,包括如下步骤:
S1、将患者特征根据功能进行分组,对缺失值和极端值进行处理:根据患者存活情况将患者分成轻症组和重症组,求出各个特征中的95百分位数值,对于极端值,使用95百分位数值进行替换,排除极端值干扰;再根据临床特征的功能相似性,将轻症组与重症组的特征分别按照特征功能分成独立特征组、心血管组、肝肾功能组以及炎症组来分别对各组内缺失值进行填充;
S2、构建一组能反映患者轻重症发展风险的特征集FS:基于遗传算法,首先编码一组二进制位串,所述二进制位串的长度与原数据集中包含的特征数目相等,二进制位串上的每个位对应一个特征是否被选择,选择5种预测性能好、但预测结果有差异的基线模型,以每个基线模型的预测输出的ROC曲线下面积作为优化目标,进行200轮迭代运算,分别构建一组特征集,每次迭代时,保留输出AUC取值在前30%的二进制位串,并在通过重组和变异产生新的二进制位串,不断迭代使目标结果最大化,最后将在半数以上基线模型特征集出现的特征进行合并,得到最终的一组特征集FS;所述5种预测性能好、但预测结果有差异的基线模型分别为梯度提升决策树、极度梯度提升、随机森林、线性回归以及支持向量机;所述特征集FS具有14种临床特征,分别为:年龄、血氧饱和度、血小板、平均动脉压、白细胞、淋巴细胞、国际标准化比值、D-二聚体、葡萄糖、谷丙转氨酶、白细胞介素-6、C-反应蛋白、降钙素原、肌钙蛋白;
S3、构建集成模型EM来将多个基线模型优势互补:使用一组系数,将S2获得的5种预测性能良好、但在预测结果有差异的基线模型进行线性组合,获得集成模型EM;
S4、根据功能关联特征扩展缺失特征,并验证预测算法:对于在外部验证集中缺失的FS中的特征,使用功能相关联的特征进行扩展取代,在外部验证集上重复上述S1-S3三个步骤,来对预测算法进行验证。
2.根据权利要求1所述的构建方法,其特征在于,S1所述缺失值填充的方法如下:对于心血管组、肝肾功能组及炎症组中某组内的某个特征的缺失值,选择根据组内在其他特征取值相近的3个个体在该特征的取值来估计,即某组内某一个体Xk特征为x1k,x2k,…,xnk,其中xnk为缺失值,则以该组内与Xk在其他特征距离d最近的3个个体在特征n的均值来估计xnk,任意个体X1与X2距离d定义为:
3.根据权利要求1所述的构建方法,其特征在于,S3所述系数的计算基于遗传算法:首先编码一组二进制位串,每个二进制位串解码为一个取值范围0到1之间的小数,精度达到小数点后8位,以EM模型预测输出的ROC曲线下面积为优化目标,迭代计算使输出ROC曲线下面积最大的系数,新的二进制位串重组和变异方法与S2中相同。
4.根据权利要求3所述的构建方法,其特征在于,S3所述集成模型EM对每个患者的预测得分为probem,等于各基线模型mi输出的预测值probi与对应的系数ci的加权平均,公式如下:
5.一种预测新冠肺炎轻重症的方法,其特征在于,基于权利要求1-4任一一项所述的构建方法获得的新冠肺炎轻重症预测模型,所述预测新冠肺炎轻重症的方法包括如下步骤:
(1)将新冠肺炎患者的临床特征输入所述的新冠肺炎重症预测模型;
(2)根据所述新冠肺炎重症预测模型提供的预测得分probem计算公式,输出被测患者的得分probem,并依据probem将被测患者分为轻型和重型。
6.根据权利要求5所述的方法,其特征在于,所述轻型和重型的判断标准为:当0probem0.5时,被测患者属于新冠肺炎轻型;当probem≥0.5时,被测患者属于新冠肺炎重型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111332027.7/1.html,转载请声明来源钻瓜专利网。