[发明专利]电子病历命名实体的识别方法、装置、远程终端及系统在审
申请号: | 202110604870.X | 申请日: | 2021-05-31 |
公开(公告)号: | CN113343696A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 赵杰;何贤英;叶明;石金铭;崔芳芳;范兆函;谭中科 | 申请(专利权)人: | 郑州大学第一附属医院 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62 |
代理公司: | 太原九得专利代理事务所(普通合伙) 14117 | 代理人: | 高璇 |
地址: | 450052 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病历 命名 实体 识别 方法 装置 远程 终端 系统 | ||
1.电子病历命名实体的识别方法,其特征在于:包括:
S10,建立多个训练好的识别模型;
S20,获取待识别的电子病例;
S30,对所述步骤S20中的电子病例进行序列标注和数据转换,将其转换为识别模型可识别的文本数据;
S40,将所述步骤S30中转换后的文本数据分别输入训练好的多个识别模型中,进行命名实体识别,分别得到多个模型的识别结果;
S50,对多个识别结果进行融合模型的运算,得到融合后的最终识别结果。
2.根据权利要求1所述的电子病历命名实体的识别方法,其特征在于:所述步骤S10,建立多个训练好的识别模型;具体包括:
S101,将已有的电子病例库中的数据进行序列标注和数据转换,形成可识别的文本数据库;
S102,将文本数据库中的数据,按比例划分为训练集和测试集;
S103,通过训练集对多个识别模型分别进行训练,得到多个训练好的识别模型;
S104,使用测试集对训练好的多个识别模型进行测试,将每个识别模型得到的测试结果,进行融合模型的运算,得到最终的测试结果;
S105,对融合后的最终测试结果进行效果评价。
3.根据权利要求2所述的电子病历命名实体的识别方法,其特征在于:所述步骤S104中,进行融合模型的运算,具体包括:
对多个识别模型得到的多个识别结果进行投票表决,将所有模型中出现概率最多的结果作为融合后的最终结果。
4.根据权利要求2所述的电子病历命名实体的识别方法,其特征在于:所述步骤S105,对融合后的最终结果进行效果评价,具体包括:
对融合后的最终结果采用多个指标进行评价,多角度评价模型的效果;其中:多个指标包括:准确率、精确率、召回率、F1值。
5.根据权利要求4所述的电子病历命名实体的识别方法,其特征在于:多个指标的表达式分别为:
准确率=所有预测正确的样本/总的样本;
精确率=识别出正确的实体数/识别出的实体数;
召回率=识别出正确的实体数/样本的实体数;
F1值=(2*精确率*召回率)/(精确率+召回率)。
6.根据权利要求1所述的电子病历命名实体的识别方法,其特征在于:所述多个识别模型包括:HMM模型、CRF模型、Bi-LSTM模型、Bi-LSTM+CRF模型、SSVM模型。
7.电子病历命名实体的识别装置,其特征在于:包括:
建立模块(10),用于建立多个训练好的识别模型;
获取模块(20),用于获取待识别的电子病例;
数据转换模块(30),用于对获取模块(10)中的电子病例进行序列标注和数据转换,将其转换为识别模型可识别的文本数据;
识别模块(40),用于将数据转换模块(30)转换后的文本数据分别输入训练好的多个识别模型中,进行命名实体识别,分别得到多个模型的识别结果;
融合模块(50),用于对多个识别结果进行融合模型的运算,得到融合后的最终结果。
8.根据权利要求7所述的电子病历命名实体的识别装置,其特征在于:所述建立模块(10)包括:
数据清洗模块(101),用于将已有的电子病例库中的数据进行序列标注和数据转换,形成可识别的文本数据库;
划分模块(102),用于将文本数据库中的数据,按比例划分为训练集和测试集
训练模块(103),用于通过训练集对多个识别模型分别进行训练,得到多个训练好的识别模型;
测试模块(104),用于使用测试集对训练好的多个识别模型进行测试,将每个识别模型得到的测试结果,进行融合模型的运算,得到最终的测试结果;
评价模块(105),用于对对融合后的最终测试结果进行效果评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110604870.X/1.html,转载请声明来源钻瓜专利网。