[发明专利]电子医疗记录数据的缺失值填充方法有效
申请号: | 201911210250.7 | 申请日: | 2019-12-02 |
公开(公告)号: | CN110957015B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 张莹;欧阳嘉伟;蔡祥睿;袁晓洁 | 申请(专利权)人: | 南开大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F18/214;G06N3/084 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 医疗 记录 数据 缺失 填充 方法 | ||
本发明提出了一种结合患者特征缺失规律的电子医疗记录数据的缺失值填充方法。本发明方法是构建由两个循环神经网络构成的联合模型,综合利用未缺失医疗数据的数值信息与患者特征的缺失规律,以判断患者生理状态并提取对应的状态特征,从而根据对应时刻患者的生理状态对各个特征缺失的值进行推断,实现合乎客观事实的患者特征缺失值的填充。对于缺失规律是非随机性的电子医疗记录数据,本发明方法的效果显著优于其他未考虑缺失规律的数据填充模型,证明医疗数据中的非随机缺失性质有助于模型判断患者生理状态,并且有益于模型对数据缺失值进行合理地填充。
技术领域
本发明属于人工智能技术领域,具体涉及多元时序数据格式的电子医疗记录数据,特别是对电子医疗记录数据中的缺失值进行推断和填充的方法。
背景技术
随着医学研究与资源存储的发展,电子医疗记录已经逐渐成为收集患者就医信息的主要存储形式,并且记录了大量与患者相关的各类医疗数据,如:生理指标、用药情况、病情发展等等,这为开展广泛的人体健康与医学诊断的研究提供了坚实的基础。
由于数据采集不规律、记录不完全、传输不稳定等问题,电子医疗记录会缺失大量数据。这些缺失值会导致用于分析的数据信息不完整并且存在偏差性,从而影响模型的分析性能,严重的会造成模型对结果的误判。并且目前大部分模型是基于完整数据集构造的,含有缺失值的数据集无法直接应用于这些模型。因此解决电子医疗记录数据中的缺失值问题是非常重要并且有意义的研究。
填充是用于解决缺失值的常见方法,此方法基于可观察到的存在值去推断并填充缺失值。传统的缺失值填充方法常基于统计推断或者机器学习,但它们忽视了电子医疗记录中的时间特性。电子医疗记录是根据患者就医数据收集而成的,每次患者被诊断都会测量并记录多个特征的数据。因此电子医疗记录是多元时序数据,传统的填充方法存在瓶颈。
近些年来,有许多深度学习的方法尝试通过循环神经网络模型捕获医疗数据中的时序关系,从而实现更加有效、准确的填充。但这些方法未考虑医疗偏颇造成的缺失非随机性,因此仍具有一定的局限性。
医疗偏颇在医疗数据中非常普遍,它反映在患者产生数据并被记录下来这个事件不是完全随机的,从而导致数据的缺失遵循着一定的规律。最常见的现象是:患者感到身体不适时会更频繁地去医院,医生发现病人身体存在异常时会执行更多地检查以诊断病情,因此这些情况下会有很多数据记录下来;而当患者身体健康时,或者医生判断患者身体好转时,往往不会进行过多的测量,这时则有大量缺失值存在。这是一个典型的医疗偏颇规律,身体状况好的人被记录下的数据往往少于身体抱恙的患者,即正常值、健康值的缺失率往往高于异常值。可见,这样的缺失非随机性蕴含大量与值关联的信息,可以帮助模型对缺失值进行更加合理、准确的填充。
综上所述,结合非随机性的缺失规律对电子医疗记录数据进行缺失值填充是一个创新的研究思路,具有重要的研究意义和应用价值。
发明内容
本发明的目的是解决现有的电子医疗记录数据的缺失值填充方法对医疗偏颇考虑不足的问题,提出一种结合数据缺失规律的电子医疗记录数据的缺失值填充方法。该方法以循环神经网络为框架,同时考虑电子医疗记录的未缺失数值信息与非随机缺失规律,使填充的数值不但数值上准确,并且合乎情理。
本发明的技术方案
电子医疗记录数据的缺失值填充方法,该方法构建一个联合循环神经网络模型,同时捕获电子医疗记录的数值信息与缺失规律,通过门机制结合这两部分以生成表征患者生理状态的特征,并基于此特征与未缺失的存在值对电子医疗记录中的缺失值进行推断并填充,最终生成可适用于各类下游分析模型的完整数据集。该填充方法的具体步骤如下:
第1、数据预处理
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911210250.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种排水效果好的塑胶跑道快速排水系统
- 下一篇:一种光学镜片用吸取提放装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置