[发明专利]基于医疗数据的充血性心衰风险预测方法、系统及设备、存储介质在审
申请号: | 202110339900.9 | 申请日: | 2021-03-30 |
公开(公告)号: | CN112951431A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李灯熬;赵菊敏;张喆 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06N20/00 |
代理公司: | 北京一品慧诚知识产权代理有限公司 11762 | 代理人: | 张宇 |
地址: | 030600 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 医疗 数据 充血 心衰 风险 预测 方法 系统 设备 存储 介质 | ||
本发明涉及大数据分析预测,特别是涉及一种基于医疗数据的充血性心衰风险预测方法、系统及设备、存储介质。包括收集充血性心力衰竭患者的医疗数据作为平面文件存储在Hadoop文件系统的各个节点,调用Hive命令创建数据表,结构化所述医疗数据;采用Cassandra管理基于Hadoop的开源数据库;利用Mahout作为算法库使用随机森林算法预测充血性心力衰竭患者预设时间段再入院风险。本发明结合机器学习技术实现有效的、自动化的充血性心力衰竭患者30天内再入院风险预测,不仅可以提高诊断效率,还能为医生提供更加客观、准确的风险预测结果,具有重要的临床应用价值。
技术领域
本发明涉及大数据分析预测技术领域,特别是涉及一种基于医疗数据的充血性心衰风险预测方法、系统及设备、存储介质。
背景技术
充血性心衰也称为慢性的心功能不全,各种原因各种的心脏疾病导致的这种结果,比如长期的冠心病、心肌缺血、长期的高血压、心肌炎,风湿性心脏病等这种情况,都会表现为最后的慢性心功能不全这些表现。目前基于人工的心衰分类,不仅耗时、费力,而且诊断结果容易受到诸多主观人为因素的影响。随着现代科学技术不断进步与发展,人工智能、大数据也被不断发现其潜能,提高了医疗数据收集的效率。
在收集到的数据中使用随机森林的算法和模型所得出的预测模型适用于医疗保健领域的各种临床风险评估。临床风险评估工具提供了关于一个人患疾病或遇到临床事件的机会的信息,这对于教育病人和医疗保健提供者监测健康状况的发展是有用的。
然而,真实世界的医疗数据本质上不仅有噪声,且具有异质性,严重倾斜,包含数百个相关或有时相关的属性;另外这些数据驻留在多个数据库中,如单个emr、实验室和成像系统、医生笔记、医疗函件、索赔、CRM系统和医院财务部门服务器。在医疗保健领域,收集、集成和分析如此庞大、复杂和嘈杂的数据是一项具有挑战性的任务。因此,医疗保健信息系统可以被视为大数据的一种形式,不仅因为其庞大的数量,也因为其复杂性和多样性,这使得传统的数据仓库解决方案非常繁琐,不适合大规模的数据探索和建模。
发明内容
本发明提供一种基于医疗数据的充血性心衰风险预测方法、系统及设备、存储介质,以满足结合机器学习技术实现有效的、自动化的充血性心力衰竭患者预设时间内,例如30天内再入院风险预测。
为实现上述技术目的,达到上述技术效果,本发明提供了一种基于医疗数据的充血性心衰风险预测方法,所述预测方法包括,
收集充血性心力衰竭患者的医疗数据作为平面文件存储在Hadoop文件系统的各个节点,调用Hive命令创建数据表,结构化所述医疗数据;
采用Cassandra管理基于Hadoop的开源数据库;
利用Mahout作为算法库使用随机森林算法预测充血性心力衰竭患者预设时间段再入院风险。
进一步地,所述预测方法包括,
加载训练数据到Hadoop文件系统中;
将原始数据预处理为可分类数据,通过选择预测器和目标变量识别每个变量类型,将每个向量类型编码为向量;
在Mahout算法库中选择随机森林算法进行分类及预测变量。
进一步地,所述向量类型包括数值型、类别型、文本型。
进一步地,所述预测方法还包括,
对不同格式的所述医疗数据进行预处理去噪,以再入院为目标值的训练数据提取特征,并通过向量化转换成模型训练使用的特征向量;
利用随机森林算法整理出预测模型;
以再入院为目标值的测试数据对训练完成的预测模型进行评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110339900.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:背板控制方法、装置及计算机设备
- 下一篇:解决天窗外观不良的汽车顶棚结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置