[发明专利]电子病历命名实体识别方法、电子设备及存储介质在审
申请号: | 202111133749.X | 申请日: | 2021-09-27 |
公开(公告)号: | CN113836926A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 李冬梅;隆娇;曲锦涛 | 申请(专利权)人: | 北京林业大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 蔡纯;张靖琳 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病历 命名 实体 识别 方法 电子设备 存储 介质 | ||
本申请公开了电子病历命名实体识别方法、电子设备及存储介质。该命名实体识别方法包括:获取电子病历的文本数据;以及将所述文本数据输入至命名实体识别模型,获得与所述文本数据相对应的命名实体识别结果,其中,所述命名实体识别模型包括嵌入层、卷积神经网络层、多头注意力层和条件随机场层。该命名实体识别方法在卷积神经网络层的单个字符识别结果的基础上,采用多头注意力层进行特征提取以解决多个字符的不同相关性问题,从而提高模型有效性。
技术领域
本发明涉及自然语言处理技术领域,更具体地,涉及基于深度学习的电子病历命名实体识别方法、电子设备及存储介质。
背景技术
临床命名实体识别(Clinical Named Entity Recognition,CNER)是自然语言处理技术在医疗信息化研究中的一项基础性关键任务,目的是从电子病历(ElectronicMedical Records,EMR)文本中识别并抽取出与医学临床相关的实体提及,并将它们归类到预定义的类别,如疾病和诊断、影像检查、实验室检验、手术、药物和解剖部位等实体。从大量半结构化或非结构化的电子病历中提取出命名实体有助于后续进一步地分析和研究,例如构建临床决策支持系统(Clinical Decision Support System,CDSS)、构建医疗领域的知识图谱等。
近年来,随着深度学习的兴起,研究者们开始将深度神经网络应用于自然语言处理领域,深度学习方法在生物医学领域中也得到了广泛应用。相比于传统的基于规则和词典的方法或机器学习方法,深度学习方法具有泛化能力更强和更少依赖规则设计或特征工程的优点。
中文医疗电子病历中的命名实体有着特殊和严谨的语言结构,使得中文CNER具有更大的挑战性。基于深度神经网络的CNER方法,存在无法准确表示具有多义性的字符或者词语的问题。例如“患者神志清、精神可”和“于我院行淋巴结清扫术”,两个句子中的“清”字在各自的语境中是两个完全不同的含义。在上下文无关的词嵌入表示方法中,两个“清”字却映射成完全相同的向量,因此,采用静态训练得到的向量无法考虑到句子的上下文语义信息。
在中文CNER任务中,后接条件随机场的双向长短期记忆网络(BidirectionalLong Short-Term Memory with Conditional Random Field,BiLSTM-CRF)方法,已经取得了显著的效果。然而,基于词的BiLSTM模型无法解决实体边界识别错误造成的误差传播问题。采用迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN)进行命名实体识别,可以同时提高训练速度和准确率,但难以有效融入句子的上下文语义信息,存在无法准确表示多义词的问题。如果引入预训练词嵌入模型BERT,则可以动态获取电子病历中每个字的嵌入表示,从而可以更准确地表示电子病历中与上下文相关的语义信息。因此,已经提出多层结构的命名实体识别模型以提高模型的有效性,如BERT-BiLSTM-CRF模型。然而,该模型复杂度过高,存储开销较大,大量的参数限制了模型效率和在实际场景中的应用。
发明内容
鉴于上述问题,本申请的目的在于提供电子病历命名实体识别方法、电子设备及存储介质,在卷积神经网络模层识别结果的基础上,采用多头注意力层以获取字符在句子中的长距离依赖特征以体现多个字符的不同相关性,从而提高模型有效性。
根据本发明的第一方面,提供一种电子病历命名实体识别方法,包括:获取电子病历的文本数据;以及将所述文本数据输入至命名实体识别模型,获得与所述文本数据相对应的命名实体识别结果,其中,所述命名实体识别模型包括嵌入层、卷积神经网络层、多头注意力层和条件随机场层,在嵌入层中,在电子病历文本的句子中提取单个字符,以及动态获取所述单个字符上下文相关的语义表示,在卷积神经网络层中,基于所述单个字符上下文相关的语义表示获取全局语义信息,在多头注意力层中,通过采用多角度捕获所述句子的多个字符之间的相关性,获得多个预测标签的概率,以及在条件随机场层中,通过约束所述多个预测标签之间的依赖关系,获得所述单个字符的最佳预测标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京林业大学,未经北京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111133749.X/2.html,转载请声明来源钻瓜专利网。