[发明专利]基于集成学习的门诊量预测方法及装置在审
申请号: | 202210442771.0 | 申请日: | 2022-04-25 |
公开(公告)号: | CN114970677A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 刘新辉;华宗楠 | 申请(专利权)人: | 上海柯林布瑞信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H40/20 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 倪焱 |
地址: | 200233 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 门诊 预测 方法 装置 | ||
1.一种基于集成学习的门诊量预测方法,其特征在于,包括:
获取门诊衍生数据,其中,所述门诊衍生数据包括至少一个训练数据集和测试数据集;
基于各所述训练数据集分别对集成学习模型的子学习模型进行训练,得到至少一个中间模型,并基于中间模型对训练数据的预测结果与对应的训练数据进行融合,得到第一融合数据,根据第一融合数据对集成学习模型中待训练子学习模型进行训练,得到目标门诊量预测模型;
基于中间模型对所述测试数据集的预测结果与所述测试数据集进行融合,得到第二融合数据,将所述第二融合数据输入至所述目标门诊量预测模型,得到预测门诊量。
2.根据权利要求1所述的方法,其特征在于,所述获取门诊衍生数据,包括:
获取原始门诊数据,对所述原始门诊数据进行数据筛选,得到筛选门诊数据;
基于所述筛选门诊数据进行特征工程处理,得到初始门诊衍生数据;
对所述初始门诊衍生数据进行划分,得到所述门诊衍生数据。
3.根据权利要求1所述的方法,其特征在于,所述门诊衍生数据包括时间戳衍生特征、时序值衍生特征和属性变量衍生特征;其中,所述时间戳衍生特征包括时间戳特征、布尔特征和时间差特征;所述时序值衍生特征包括滞后特征、滑动窗口统计特征和扩展窗口统计特征;所述属性变量衍生特征包括非门诊量特征。
4.根据权利要求3所述的方法,其特征在于,所述时序值衍生特征的确定方法包括:
确定各科室门诊量之间的相关性信息;
基于所述各科室门诊量之间的相关性信息确定时序值衍生特征。
5.根据权利要求1所述的方法,其特征在于,所述集成学习模型包括第一子学习模型和第三子学习模型;所述基于各所述训练数据集分别对集成学习模型的子学习模型进行训练,得到至少一个中间模型,并基于中间模型对训练数据的预测结果与对应的训练数据进行融合,得到第一融合数据,根据第一融合数据对集成学习模型中待训练子学习模型进行训练,得到目标门诊量预测模型,包括:
基于第一训练数据集对所述第一子学习模型进行训练,得到第一中间模型,将第二训练数据集输入至所述第一中间模型,得到第一预测结果;
将所述第一预测结果和所述第二训练数据集进行融合,得到第一融合数据;
基于所述第一融合数据对所述第三子学习模型进行训练,得到目标门诊量预测模型。
6.根据权利要求5所述的方法,其特征在于,所述集成学习模型还包括第二子学习模型,所述基于中间模型对所述测试数据集的预测结果与所述测试数据集进行融合,得到第二融合数据,将所述第二融合数据输入至所述目标门诊量预测模型,得到预测门诊量,包括:
基于所述第二训练数据集对所述第二子学习模型进行训练,得到第二中间模型,将所述测试数据集输入至所述第二中间模型,得到第二预测结果;
将所述第二预测结果和所述测试数据集进行融合,得到第二融合数据;
将所述第二融合数据输入至所述目标门诊量预测模型,得到预测门诊量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海柯林布瑞信息技术有限公司,未经上海柯林布瑞信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210442771.0/1.html,转载请声明来源钻瓜专利网。