[发明专利]患者住院时长的预测方法、装置、电子设备及存储介质在审
申请号: | 202011136028.X | 申请日: | 2020-10-22 |
公开(公告)号: | CN112365943A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 吴静依;李鹏飞;李青;张路霞 | 申请(专利权)人: | 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G16H70/20;G06K9/62;G06N20/00 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 311200 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 患者 住院 预测 方法 装置 电子设备 存储 介质 | ||
1.一种患者住院时长的预测方法,其特征在于,包括:
利用多个二分类基学习器级联串接构建有序多分类的预测模型;
利用训练数据集训练各个所述基学习器直至每一所述基学习器达到性能指标要求,得到训练好的预测模型;
根据预设预测特征,选取待预测样本输入所述训练好的预测模型,得到预测结果。
2.根据权利要求1所述的方法,其特征在于,在所述利用训练数据集训练各个所述基学习器之前,所述预测方法还包括:
基于医院信息管理系统中患者的电子病历数据,进行数据清理,提取训练数据构成训练数据集。
3.根据权利要求2所述的方法,其特征在于,在所述根据预设预测特征,选取待预测样本输入所述训练好的预测模型之前,所述预测方法还包括:
从所述医院信息管理系统的电子病历数据中或者从所述训练数据集中筛选出对患者的住院时长预测价值高的预测特征;
结合专家知识对所筛选的预测特征进行补充与调整,得到预设预测特征。
4.根据权利要求2所述的方法,其特征在于,所述进行数据清理,包括:
剔除缺失率过高的患者数据,剔除异常数据,以及随机填补数据缺失值。
5.根据权利要求1所述的方法,其特征在于,所述二分类基学习器为梯度提升决策树算法。
6.根据权利要求1所述的方法,其特征在于,所述利用训练数据集训练各个所述二分类基学习器直至每一所述二分类基学习器达到性能指标要求,包括:
S1、将所述训练数据集输入所述预测模型,设定初始值m=1;单个训练样本输入格式为(x,y);y为包含有序M分类的结局变量,x代表训练样本的预测特征的集合;M为所述预测模型的分类类别的数量;
S2、判断m是否<M;若是,则进入步骤S3;若否,则跳到步骤S7;
S3、提取y≥第m类别的数据作为第m个基学习器的训练数据子集;
S4、用第一训练标签标记所述训练数据子集中y=第m类别的数据,用第二训练标签标记所述训练数据子集中y>第m类别的数据;
S5、基于上述步骤获得的所述训练数据子集与训练标签,训练所述二分类基学习器,得到第m个基学习器;
S6、m自增1后更新,返回步骤S2;
S7、输出训练完成的M-1个基学习器。
7.根据权利要求6所述的方法,其特征在于,采用随机超参数搜索结合五折交叉验证方法实现各个基学习器的超参数优化,使用F1分数作为超参数寻优的模型预测性能的参考指标。
8.根据权利要求1所述的方法,其特征在于,所述预测方法还包括:
基于医院信息管理系统中电子病历数据的更新,定期同步对所述预测模型进行更新。
9.一种患者住院时长的预测装置,其特征在于,包括:
构建模块,用于利用多个二分类基学习器级联串接构建有序多分类的预测模型;
训练模块,用于利用训练数据集训练各个所述基学习器直至每一所述基学习器达到性能指标要求,得到训练好的预测模型;
预测模块,用于根据预设预测特征,选取待预测样本输入所述训练好的预测模型,得到预测结果。
10.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-8中任一所述的患者住院时长的预测方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-8中任一所述的患者住院时长的预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011136028.X/1.html,转载请声明来源钻瓜专利网。