[发明专利]一种基于自适应集成学习模型的再入院风险预测方法有效
申请号: | 202010971129.2 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112086195B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 邱航;张振;郑鑫;胡智栩 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06N3/126 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 何凡 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 集成 学习 模型 再入 风险 预测 方法 | ||
本发明公开了一种基于自适应集成学习模型的再入院风险预测方法,包括以下步骤:采集患者的基本信息和临床诊疗信息,并构建临床高维特征矩阵以及再住院标签;对临床高维特征矩阵依次进行数据预处理和KPCA降维,得到降维特征集;构建自适应集成学习模型并根据降维特征集和再住院标签对其训练,将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。本发明提出了一种基于自适应集成学习模型的再入院风险预测方法,通过集成学习模型准确预测患者再入院风险,辅助医生对高风险患者提前采取干预措施,有助于降低患者疾病负担、减轻患者经济负担,有助于降低医院再入院率以及提升医疗服务质量。
技术领域
本发明属于计算机科学领域,具体涉及一种基于自适应集成学习模型的再入院风险预测方法。
背景技术
再入院率是反映医院医疗质量和管理水平的重要指标,准确预测患者再入院风险,为医生和医院管理者提供辅助决策支撑,从而可以有效降低再入院率。在提高医疗服务质量和降低治疗费用的同时,帮助医院更加有效合理的分配医疗资源。目前,关于再入院风险预测研究仍存在一些问题:
再入院风险预测的特征具有高维、非线性的特点,传统的线性降维方式不能取得很好的降维效果。
再入院风险预测主流方法分为两种:一是传统的统计学方法,这类方法的预测精度不高;另一种是机器学习算法,在一定程度上解决传统统计学方法预测精度不足的问题,但预测效果仍有待提升。集成学习模型使用多个基模型的预测结果作为训练一个新的元学习器的特征,已经被成功地应用在一些科学领域的预测,并被证明比单个机器学习模型更有效。但在再入院风险预测的研究中,由于缺乏背景知识,集成学习模型很难选择有效的模型组合,进而影响了模型的预测效果。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于自适应集成学习模型的再入院风险预测方法解决了现有技术中存在的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于自适应集成学习模型的再入院风险预测方法,包括以下步骤:
S1、采集患者的基本信息和临床诊疗信息,并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签;
S2、对临床高维特征矩阵进行数据预处理,并对预处理后的临床高维特征矩阵进行KPCA降维,得到降维特征集;
S3、构建自适应集成学习模型,并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练;
S4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。
进一步地,所述步骤S3中构建自适应集成学习模型的具体步骤为:
C1、选择备选基模型和元学习器;
C2、通过遗传算法自适应地选择不同元学习器对应的基模型,构建3个最优集成模型;
C3、以权重投票机制为基础,并通过粒子群优化算法调整3个集成模型的权重,获取自适应集成学习模型。
进一步地,所述步骤C1中备选基模型包括支持向量机、逻辑斯特回归、贝叶斯模型、分类和回归树、梯度提升决策树、极端随机树、随机森林、卷积神经网络、多层感知机、极端梯度提升、引导聚集算法和自适应增强算法;
所述步骤C1中元学习器包括线性模型Logistic Regression、树模型Classification and Regression Tree和深度学习模型Multi-layer Perceptron。
进一步地,所述步骤C2包括以下分步骤:
C2.1、对所有备选基模型进行离散化,采用二进制编码方法对离散化后的备选基模型进行编码,并初始化,随机生成M个编码个体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010971129.2/2.html,转载请声明来源钻瓜专利网。