[发明专利]确定心血管疾病潜在不适当处方的风险预警模型的方法在审
申请号: | 202210168629.1 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114530248A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 童荣生;吴行伟;常欢;温亚林 | 申请(专利权)人: | 四川省医学科学院·四川省人民医院 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H10/60;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都华复知识产权代理有限公司 51298 | 代理人: | 王洪霞 |
地址: | 610072 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 心血管疾病 潜在 不适当 处方 风险 预警 模型 方法 | ||
1.一种确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,包括以下步骤:
S1:对心血管病人病历信息进行删除身份证号码、姓名、家庭住址、电话号码信息的脱敏处理,对所述经过脱敏处理的病例数据进行数据处理,所述数据处理包括数据采样和特征筛选,得到N个数据集,将N个数据集分为训练集和测试集,所述训练集和测试集多于测试集,使用M种机器学习模型对N个数据集建模,建立N×M个风险预警模型;
S2:使用十折交叉验证法进行内部验证:将训练集数据输入M种机器学习模型中,使用十折交叉验证法调整模型参数,直到所述模型参数在训练集上得到最大的AUC值,得到PIP模型、PPO模型和PIM模型内部验证的数据采样、特征采样和机器学习模型的AUC值、准确率、精准率、召回率、F1值;
S3:通过选择AUC值最大的多个模型,生成一个集成模型,使用模这M+1种机器学习模型对N个数据集建,建立N×(M+1)个风险预警模型;
S4:使用Bootstrapping法进行外部验证:对测试集使用Bootstrapping法进行n次重抽样,建立新样本,使用新样本对N×(M+1)个风险预警模型进行外部验证,得到PIP模型、PPO模型和PIM模型外部验证的数据采样、特征采样和机器学习模型的AUC值、准确率、精准率、召回率、F1值;
S5:使用AUC、准确率、精准率、召回率、F1值指标评价模型,选择AUC最大值的模型作为预测性能最佳的五个模型,得到所述五个模型的ROC曲线和P-R曲线,选择ROC曲线值最大的模型作为PIP模型、PIM模型和PPO模型各自对应的预测性能最准确的风险预警模型;
S6:计算预测性能最准确的风险预警模型中每个变量的SHAP值,使用SHAP值表示输出的每个变量与最佳模型预测结果的关系,以每个变量的SHAP值的绝对值的平均值作为该变量的重要性,分别排列每个变量对最佳预测模型的贡献值,得到每个变量对于PIP、PIM和PPO风险预警输出。
2.如权利要求1所述的确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,所述数据处理还包括:删除数据缺失比例高于90%的变量、单个类别比例高于90%的变量以及变异系数小于0.1的变量,所述N个数据集按8∶2比例划分为训练集和测试集,所述N个数据集分别采用x种不同的数据采样方式进行数据采样,再分别采用y种不同的数据筛选方式进行数据筛选,得到N个所述数据集,其中,N=x×y。
3.如权利要求2所述的确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,所述变量包括心肌梗塞、心脏传导阻滞、静脉血栓栓塞、痛风史、肾衰竭、抗凝治疗、心绞痛、动脉粥样硬化、心力衰竭、糖尿病、用药数量、患病数量、性别、住院时间、年龄、消化道出血、抗血栓治疗、心血管病史、脑血管疾病、心房颤动、高血脂和高血压。
4.如权利要求1所述的确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,所述心血管病人病历信息采用第二版STOPP/START标准中的心血管系统和抗血小板/抗凝药物识别老年患者中可能存在的PIP的处方,包括心血管系统和抗血小板/抗凝药物的PIM标准和心血管系统的PPO标准,所述脱敏处理包括删除患者的身份证号码、姓名、家庭住址、电话号码信息。
5.如权利要求1所述的确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,还包括所述数据集验证,验证所述的确定心血管疾病潜在不适当处方的风险预警模型的方法所需求的数据集数量。
6.如权利要求5所述的确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,所述样本量验证采用有放回的重抽样法从训练集中依次随机抽取数据训练模型,测试集得到多组不同的AUC值,重复n次,得到AUC值绘制折线图,随着数据量不断增加,AUC逐渐增加,数据的离散度不断减少,曲线不断地趋于平缓,曲线趋于平缓,得出模型中样本量足够,得出可满足模型需求的数据量。
7.如权利要求1所述的确定心血管疾病潜在不适当处方的风险预警模型的方法,其特征在于,还包括假设检验,通过现有数据量推断总体,得到现有数据量指标和总体指标之间的差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川省医学科学院·四川省人民医院,未经四川省医学科学院·四川省人民医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210168629.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高盐高COD难降解有机废水资源化利用方法
- 下一篇:一种取餐柜及取餐系统