[发明专利]基于LightGBM算法的门诊量预测系统及预测方法有效
申请号: | 201910276901.6 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110046757B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 刘健;张瑶;张翼飞;李宝娟;黄鹏;韦磊;尚子田;宁玉文;张军超;靳豪杰;许浩;唐甜;冯健飞;沈霞娟 | 申请(专利权)人: | 中国人民解放军第四军医大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16H40/20 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710032 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lightgbm 算法 门诊 预测 系统 方法 | ||
本发明公开了一种基于LightGBM算法的门诊量预测系统及预测方法,属于数据处理领域。本发明在构造了时间特征、门诊量特征以及关键字百度指数三类特征后,利用遗传算法对多种特征进行综合筛选,在此基础上使用LightGBM算法对数据进行训练,建立了某疾病某科室的门诊量的预测模型。通过在测试数据集上对模型的预测性能进行测试,结果表明该模型能够对门诊量作出较为准确的预测,模型的可解释程度也相对较好。
技术领域
本发明属于数据处理技术领域,涉及一种基于LightGBM算法的门诊量预测系统及预测方法。
背景技术
目前,在门诊量预测方面应用的方法大致可以分为两类,即基于时间序列分析的方法和基于机器学习的方法。其中,基于时间序列分析的方法是目前应用的最为广泛的一类方法,主要包括ARMA模型、ARIMA模型以及小波分析等,其基本思想是利用历史数据分析随机序列的模式,进而对未来时间点上的门诊量进行估计。这种方法的优点在于能够充分利用历史数据,分析研究其变化规律,但缺点也十分明显,即仅仅将医院门诊量看作是一组随机序列,而忽略了其他的要素对门诊量的影响。近年来随着人工智能和深度学习的兴起,部分学者开始尝试使用机器学习的方法来对医院的门诊量进行预测并取得了一定的成功。但是目前在该领域,大多数学者所使用的特征大多仍为门诊量自身,未能更多的借助于外部数据。
近年来,随着信息技术的不断发展,使得人们生活的方方面面都发生了翻天覆地的变化。在医疗卫生健康方面,信息技术不仅通过就医卡、移动支付等手段使得就医过程变得更加简单、便捷和安全,同时也使得人们的就医习惯发生了改变。人们在前往医院就诊之前,往往会使用搜索引擎和各类移动App对自己的症状、医院的科室以及相关的知名医师等信息进行搜索。因此,不难推断,特定关键词的检索与病患的就医行为之间可能存在着某种关联关系。但是,当前还鲜有关于此类方法的相关研究。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于LightGBM算法的门诊量预测系统及预测方法,能够充分利用多种外在信息,精准预测某疾病在多种尺度下的门诊量,从而提高医院的管理水平,提升应急处置能力。
为了达到上述目的,本发明采用以下技术方案予以实现:
本发明公开的一种基于LightGBM算法的门诊量预测系统,包括数据预处理模块、特征构建模块、特征选择模块和模型训练模块;其中:
数据预处理模块,用于从原始门诊信息中提取原始门诊量数据;
特征构建模块,用于将原始门诊量数据,以及包含时间信息和百度指数信息的外部数据分别构建得到门诊量特征、时间特征和关键字百度指数特征;
特征选择模块,用于从门诊量特征、时间特征和关键字百度指数特征中选取相关系数≥0.1且置信概率≤0.005的特征,再利用遗传算法,进行筛选确认,获得样本特征;
模型训练模块,用于利用样本特征在训练数据集上使用LightGBM算法对预测模型进行训练,构建得到基于LightGBM的门诊量预测模型。
优选地,数据预处理模块中,从原始门诊信息中提取原始门诊量数据是指移除具有规律性的人员数据和错误的门诊数据。
进一步优选地,原始门诊信息包括门诊用户的来访日期、病人ID、诊断信息以及疾病信息;所述的具有规律性的人员数据包括取药人员、开药人员、复诊人员和复查人员;所述的错误的门诊数据包括挂错号人员、fuchsa人员、fuccha人员和买药人员。其中,fuchsa人员、fuccha人员由于医生个人笔误造成的结果。
优选地,特征构建模块中,构建的时间特征为:当天是否为休息日、当天所在假期的长度、当天到前/后一个假期的时间间隔、当天前/后一个假期的长度、当天是否为周一/二/三/四/五/六/日;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军第四军医大学,未经中国人民解放军第四军医大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910276901.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理