[发明专利]一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质在审
申请号: | 202110405703.2 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113517046A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 安莹;唐琨;陈先来 | 申请(专利权)人: | 中南大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 姚瑶 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 病历 中异构 数据 特征 融合 方法 基于 预测 系统 可读 存储 介质 | ||
本发明公开了一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质,所述方法包括:步骤1:将患者的电子病历数据进行处理构成患者的就诊向量;步骤2:将每类数据的就诊向量作为原始输入数据,分别利用Bi_LSTM模型和CNN模型提取时序特征和非时序特征;步骤3:分别综合每类数据的时序特征和非时序特征得到综合特征;步骤4:利用所述综合特征挖掘每类数据的之间的作用信息得到每类数据对应的最终特征。其中,利用得到最终特征可以用于疾病风险预测,本发明综合了不同类型医学数据各自的时序和非时序特征及其之间的相互关系,以获得更准确的患者表示特征,进而提高了疾病风险预测结果的可靠性。
技术领域
本发明属于医疗领域的数据处理技术,具体涉及一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质。
背景技术
根据世界卫生组织的统计,全球每年有超过4100万的人死于像心血管疾病、糖尿病、呼吸系统疾病等慢性病。在这其中,心血管疾病是主要的致死疾病。这严重影响了人们的健康,并且给社会和经济带来了极其沉重的负担。因此,预测心血管疾病的发病对该病的早期预防和控制具有重要意义。
随着医院信息化水平的不断提高,医疗机构都积累了大量的电子病历(electronic health record,EHR)数据,其中包含了极其丰富的患者信息,包括诊断、化验、检查、用药、人口学信息和临床笔记等临床信息。基于电子病历数据,每个病人都可以表示为一个时间序列的医院就诊记录,每次就诊都包含一组异构的临床变量。由于EHR数据的全面性和易用性,它被广泛应用于医学预测的相关研究中,包括特定疾病的风险预测、未来的诊断、再入院预测、死亡率预测等。
对于EHR记录,异构性是其显著特征之一,如何有效地整合不同类型的电子病历数据以获得全面的患者表征是EHR预测建模的关键挑战。由于深度学习方法自身良好的自动特征学习能力,避免了传统特征工程对于大量人工的依赖,近年来已经得到了广泛的应用并取得了一定的成功。学者们提出了一系列基于深度神经网络的预测方法,试图通过深度学习方法强大的自动特征学习能力,从异类EHR数据中获取相关疾病发展模式,并且也取得了很好的效果。作为深度神经网络的典型代表,卷积神经网络(CNNs)和循环神经网络(RNNs)是最常用的模型。对于这两种神经网络,虽然CNN能有效地保留序列数据的邻域关系和局部特征,但由于其丢失了部分和整体之间的相关性,在时态数据挖掘中受到限制。而且现有的基于CNN的方法大多假设医院就诊过程中的医疗事件是严格按时间顺序记录的,而实际上通常不是这样。这进一步限制了这些方法的整体性能。
与CNN相比,RNN具有更好的时序建模能力,广泛应用于机器翻译、时间序列预测、语音识别、自然语言处理等领域。为了从序列数据中获取更丰富的上下文信息,使结果更易于理解,现有的方法通常在基于EHRs的时序学习模型中同时应用注意力机制,也取得了相当的成功。注意力机制不仅能有效地提升预测性能,同时也为模型提供了一定的可解释性。异构性是EHR数据的固有特性,患者的每次就诊记录通常包含各种类型的医疗事件信息。如何充分挖掘隐藏在不同类型的EHR序列数据中的独特时序模式,进而形成全面的患者表示,也是基于EHR数据的深度学习模型面临的挑战之一。近年来,一些学者也提出了一些改进的方法来整合多种类型的医学数据。比如将不同类型的原始数据作为一个整体来处理在这些方法中,或者为不同类型的数据建立独立的模块以最大程度地保留其自身的特征。这些方法虽然考虑了不同类型医学数据的差异,但异类数据之间的相互联系还没有得到充分的挖掘。而且大多数方法都是通过简单地将不同类型数据的相关特征向量串联起来,从而构造最终的患者表示,无法真正实现多方面医学特征的有效融合。
发明内容
本发明考虑了不同类型医学数据之间的差异,提供一种全新的多类型数据融合表示学习模型,该模型综合了不同类型医学数据各自的时序和非时序特征及其之间的相互关系,以获得更准确的患者表示。
一方面,本发明提供的一种电子病历中异构数据特征融合方法,包括如下步骤:
步骤1:将患者的电子病历数据进行处理构成患者的就诊向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110405703.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置