[发明专利]一种基于自适应集成学习模型的再入院风险预测方法有效
申请号: | 202010971129.2 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112086195B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 邱航;张振;郑鑫;胡智栩 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06N3/126 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 何凡 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 集成 学习 模型 再入 风险 预测 方法 | ||
1.一种基于自适应集成学习模型的再入院风险预测方法,其特征在于,包括以下步骤:
S1、采集患者的基本信息和临床诊疗信息,并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签;
S2、对临床高维特征矩阵进行数据预处理,并对预处理后的临床高维特征矩阵进行KPCA降维,得到降维特征集;
S3、构建自适应集成学习模型,并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练;
其中,所述步骤S3中构建自适应集成学习模型的具体步骤为:
C1、选择备选基模型和元学习器;
C2、通过遗传算法自适应地选择不同元学习器对应的基模型,构建3个最优集成模型;
具体地,所述步骤C2包括以下分步骤:
C2.1、对所有备选基模型进行离散化,采用二进制编码方法对离散化后的备选基模型进行编码,并初始化,随机生成M个编码个体;
C2.2、对每个编码个体所对应的基模型和元学习器所构建的集成学习模型进行训练,采用AUC作为适应度函数,并计算训练后每个编码个体的适应度值;
C2.3、将编码个体的适应度值与总群体的适应度值的比值作为选择最优基模型组合的准则,剔除适应度比值较小的N个编码个体;
C2.4、随机添加N个编码个体到现有群体中;
C2.5、设置交叉概率为0.6,从现有群体的每个编码个体中随机抽取两个基模型作为交叉点,并进行交叉操作;
C2.6、设置变异概率为0.1,并对现有群体中每个编码个体进行变异操作;
C2.7、重复步骤C2.2-C2.6若干次,将现有种群中AUC值最大的集成学习模型作为特定元学习器对应的最优集成学习模型;
C2.8、根据步骤C2.1-C2.7所述方法,分别获取步骤C1中3个元学习器对应的3个最优集成学习模型;
所述步骤C2.5中交叉操作具体为交换两个交叉点的选中状态;
所述步骤C2.6中变异操作具体为以设置的变异概率改变基模型的选中状态;
C3、以权重投票机制为基础,并通过粒子群优化算法调整3个集成模型的权重,获取自适应集成学习模型;
具体地,所述步骤C3包括以下分步骤:
C3.1、设置每个粒子为自适应集成学习模型中最优集成学习模型的权重,设置适应度函数为最优集成学习模型的AUC值,并初始化l个粒子的速度和位置,所述粒子g为3维向量,其位置Ug和速度Vg为:
其中,ug1,ug2,ug3分别表示粒子g的第1、2、3维的位置,vg1,vg2,vg3分别表示粒子g的第1、2、3维的速度;
C3.2、设置迭代次数为B、计数器k=0、个体最优解pbest=0以及全局最优解gbest=0;
C3.3、计算粒子g的适应度函数值,若是适应度函数值大于其个体最优解pbestg,则令个体最优解pbestg为粒子g的当前适应度函数值;
C3.4、更新全局最优解gbest为:
gbest=max{pbest1,pbest2,...,pbestg,...,pbestl}
C3.5、对粒子g的速度和位置进行更新,更新公式为:
其中,表示粒子g在第k次迭代的第d维速度更新值,表示粒子g在第k次迭代的第d维的速度,c1表示第一加速度系数,c2表示第二加速度系数,r1和r2均表示[0,1]中的随机数,表示粒子g子在第k次迭代中第d维的最佳位置,表示所有粒子在第k次迭代中第d维的最佳位置,表示粒子g在第k次迭代的第d维位置更新值,表示粒子g在第k次迭代的第d维的位置,d=1,2,3;
C3.6、判断计数器k是否等于迭代次数B,若是则进入步骤C3.7,否则返回步骤C3.3;
C3.7、输出全局最优解为gbest=[u1,u2,u3],并得到自适应集成学习模型final_Model为:
final_Model=u1*Model1+u2*Model2+u3*Model3
其中,u1,u2,u3分别表示ug1,ug2,ug3的全局最优解,Modelf表示第f个最优集成学习模型,uf表示第f个最优集成学习模型的权重,f=1,2,3;
S4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。
2.根据权利要求1所述的基于自适应集成学习模型的再入院风险预测方法,其特征在于,所述步骤C1中备选基模型包括支持向量机、逻辑斯特回归、贝叶斯模型、分类和回归树、梯度提升决策树、极端随机树、随机森林、卷积神经网络、多层感知机、极端梯度提升、引导聚集算法和自适应增强算法;
所述步骤C1中元学习器包括线性模型LogisticRegression、树模型ClassificationandRegressionTree和深度学习模型Multi-layer Perceptron。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010971129.2/1.html,转载请声明来源钻瓜专利网。