[发明专利]电子病历命名实体的识别方法、装置、远程终端及系统在审
申请号: | 202110604870.X | 申请日: | 2021-05-31 |
公开(公告)号: | CN113343696A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 赵杰;何贤英;叶明;石金铭;崔芳芳;范兆函;谭中科 | 申请(专利权)人: | 郑州大学第一附属医院 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62 |
代理公司: | 太原九得专利代理事务所(普通合伙) 14117 | 代理人: | 高璇 |
地址: | 450052 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病历 命名 实体 识别 方法 装置 远程 终端 系统 | ||
本发明提供的电子病历命名实体的识别方法、装置、远程终端及系统,所述识别方法包括:S10,建立多个训练好的识别模型;S20,获取待识别的电子病例;S30,对所述步骤S20中的电子病例进行序列标注和数据转换,将其转换为识别模型可识别的文本数据;S40,将所述步骤S30中转换后的文本数据分别输入训练好的多个识别模型中,进行命名实体识别,分别得到多个模型的识别结果;S50,对多个识别结果进行融合模型的运算,得到融合后的最终识别结果;本发明具有能够提高医疗类实体识别准确度,进而提高医院校对患者出院信息的工作效率的有益效果,适用于自然语言处理的领域。
技术领域
本发明涉及自然语言处理的技术领域,具体涉及电子病历命名实体的识别方法、装置、远程终端及系统。
背景技术
随着计算机等信息技术的飞速发展,各大医院的信息化建设也逐渐完善,每时每刻都在产生大量的医疗数据,虽然大部分的病历都已经电子化,但是其发挥的作用依然非常有限,如果数据不能得到有效地利用,则大大浪费了数据的宝贵价值。
电子病历(Electronic Medical Record,EMR)是指医务人员在医疗活动中,通过医疗信息系统产生的文字、图表、影像等信息,是患者身体各个方面的信息的专业描述,是宝贵的医疗记录。
在患者办理出院手续时,需要从电子病例中,通过命名实体识别出有效信息进行手续的办理,然而,对于医疗类实体,传统的命名实体识别方法的识别结果不够准确,经常因为信息的错误、缺失等问题影响办理,即耽误了患者时间,又影响了医院的效率。
在自然语言处理研究方面,命名实体识别(NER)技术可用于识别文本中的特定实体信息,如人名、地名、组织名称等,它广泛应用于信息抽取、信息检索、智能问答、机器翻译等领域;命名实体识别准确率和召回率的高低,直接决定着语法分析、语义分析等语言理解全过程的性能。
然而,目前基于自然语言处理的中文电子病历命名实体识别方法,通常有隐马尔可夫模型(Hidden Markov Model,HMM)、条件随机场(Conditional Random Field,CRF)、基于深度学习的LSTM等方法,不同的方法都有各自的优缺点;随着数据量的不断增大、越来越复杂,基于现有方法已无法满足对高准确度的保证。
发明内容
针对相关技术中存在的不足,本发明所要解决的技术问题在于:提供一种能够提高医疗类实体识别准确度,进而提高医院校对患者出院信息的工作效率的电子病历命名实体的识别方法、装置、远程终端及系统。
为解决上述技术问题,本发明采用的技术方案为:
电子病历命名实体的识别方法,包括:
S10,建立多个训练好的识别模型;
S20,获取待识别的电子病例;
S30,对所述步骤S20中的电子病例进行序列标注和数据转换,将其转换为识别模型可识别的文本数据;
S40,将所述步骤S30中转换后的文本数据分别输入训练好的多个识别模型中,进行命名实体识别,分别得到多个模型的识别结果;
S50,对多个识别结果进行融合模型的运算,得到融合后的最终识别结果。
优选地,所述步骤S10,建立多个训练好的识别模型;具体包括:
S101,将已有的电子病例库中的数据进行序列标注和数据转换,形成可识别的文本数据库;
S102,将文本数据库中的数据,按比例划分为训练集和测试集;
S103,通过训练集对多个识别模型分别进行训练,得到多个训练好的识别模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110604870.X/2.html,转载请声明来源钻瓜专利网。