[发明专利]一种基于短文本分类的电子病历数据质量评价方法在审
申请号: | 202110587641.1 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113360643A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 叶方全;陈逸龙 | 申请(专利权)人: | 重庆南鹏人工智能科技研究院有限公司;广州天鹏计算机科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08;G16H10/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 分类 电子 病历 数据 质量 评价 方法 | ||
本发明公开了一种基于短文本分类的电子病历数据质量评价方法,包括如下步骤:S1:数据处理;S2:依据识别;S3:质量评价。本发明提出了一种基于短文本分类的方法,先将电子病历原始文本拆分成较短的句子,再构建BiLSTM‑Attention模型来对短句进行分类,最后根据分类结果是否与诊断一致,作出相应的评价。本发明提出的方法不需要人工处理电子病历的原始文本,不但节省了人力和时间成本,还降低了对专业医学人员的要求。同时,深度学习模型能够充分利用海量的电子病历数据,对拆分的句子进行有效的分类,从而作出合理的评价。
技术领域
本发明属于电子病历数据质量评价技术领域,具体涉及一种基于 短文本分类的电子病历数据质量评价方法。
背景技术
随着大数据时代的到来,计算机网络技术在医疗领域得到广泛应 用,各种医疗机构通过信息化管理系统收集了海量电子病历数据,用 以取代传统的手写纸质病历。电子病历记录了医生对患者进行诊断治 疗的全过程,包含症状、体征、诊断、处方等信息,在辅助诊断、风 险预测、药品推荐等领域具有极大的潜在价值。然而,由于医疗机构 的数据管理水平有限,以及医生的诊断治疗能力不足,电子病历数据 中存在大量非标准描述文本,导致记录的信息不准确不完整,直接影 响到医学研究与产品开发的效率和质量。因此,需要对电子病历进行 数据质量评价,以此为依据来筛选高质量的电子病历,从而减少噪声 信息和冗余信息的干扰,这对完成医学数据分析、预测模型研究、辅 助系统开发等任务都具有重要意义。
现有的电子病历数据质量评价方法主要分为两种,一种是人工评 价的方法,另一种是信息抽取结合依据识别的方法。人工评价方法由 专业的医学人员直接对每一份电子病历进行检查,凭借自身的临床诊 治经验确认其中是否存在描述不准确、诊断不完整、依据不充分等问 题,从而作出可靠的评价。这种方法的优点在于评价结果稳定有效, 而缺点在于人力和时间成本非常高。信息抽取结合依据识别的方法先 利用问答系统从电子病历中抽取患者的关键信息,再通过逻辑回归、 决策树、随机森林等机器学习算法构建依据识别模型,根据关键信息 能否提高充分的诊断依据,对电子病历作出评价。这种方法的优点在 于可以高效地处理海量电子病历,节省了人力和时间成本,而缺点在 于依据识别模型的表现在很大程度上取决于信息抽取结果的好坏。信 息抽取先由医学专家设计规则和制定标准,再从原始文本中匹配结构 化数据,最后对其进行标准化处理,得到的结果存在较大的不确定性。 由于两种方法都有明显的不足,目前电子病历的数据质量评价仍然是 一个挑战。
综上所述,电子病历存在数据质量问题,需要一种准确高效的数 据质量评价方法来解决。
发明内容
本发明的目的在于提供一种基于短文本分类的电子病历数据质 量评价方法,以解决上述背景技术中所提出的问题。
为实现上述目的,本发明提供以下技术方案:一种基于短文本分 类的电子病历数据质量评价方法,其结构要点在于:包括如下步骤:
S1:数据处理:
S1.1:将电子病历数据分类,分成现病史、体格检查、影像学检 查、实验室检验,根据不同疾病的诊断依据构建对应的数据集;
S1.2:分别将不同类别的数据拆分成短文本序列,以逗号和句号 为分隔符,分割原始数据形成短句样本,根据短句样本及其诊断结果 构建短文本数据集;
S1.3:去除包含诊断描述的短句样本,避免直接提示对应的诊断 结果;
S2:依据识别:
S2.1:将数据集按4:1划分为训练集和验证集,所述的训练集用 于训练模型,基于预测标签与真实标签的误差,通过交叉熵损失函数 来优化模型,交叉熵损失计算如下:
其中,l是标签数量,y是真实标签,是预测标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆南鹏人工智能科技研究院有限公司;广州天鹏计算机科技有限公司,未经重庆南鹏人工智能科技研究院有限公司;广州天鹏计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110587641.1/2.html,转载请声明来源钻瓜专利网。