[发明专利]电子病例实体标记方法、装置、计算机设备及存储介质在审
申请号: | 202010917927.7 | 申请日: | 2020-09-03 |
公开(公告)号: | CN111986765A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 李术扬;宋文鸿;胡毛毛;何世敏 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/117;G06F40/289;G06F16/33;G06F16/36;G06F16/27 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 迟珊珊;何春兰 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病例 实体 标记 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及数字医疗技术领域,提供一种电子病例实体标记方法、装置、计算机设备及存储介质,包括:识别历史电子病例中的多个实体;根据预设实体显示类型显示所述历史电子病例及所述历史电子病例中的所述多个实体;为每个实体添加锚点,并通过所述锚点接收用户对对应的实体的更新得到更新信息;将所述历史电子病例及所述历史电子病例中的多个实体及对应的更新信息存储在历史电子病例实体表中;基于所述历史电子病例实体表训练BiLSTM‑CRF模型得到实体标记模型;使用所述实体标记模型对待标记的电子病例进行实体标记。本发明能够提高电子病例实体标记的准确率。
技术领域
本发明涉及数字医疗技术领域,具体涉及一种电子病例实体标记方法、装置、计算机设备及存储介质。
背景技术
健康医疗大数据是我国重要的基础性战略资源,中文电子病历的实体识别有助于从大量非结构化文本中提取重要信息,从而为医疗数据挖掘与应用奠定基础。通常的做法是检索病历库并从中找到符合上述条件的电子病历,再筛选出最终的结果,其操作繁琐复杂,费时费力。
在人工智能(AI)及大数据爆发的今天,也有不少通过AI模型给电子病例打标签从而达到病历筛选的目的,但由于中文存在一词多义及一义多词的现象,导致使用AI模型为电子病例打标签准确度较差,电子病例的标记不准确,根据电子病例的标记进行电子病例的查询时查询结果准确度较低。
发明内容
鉴于以上内容,有必要提出一种电子病例实体标记方法、装置、计算机设备及存储介质,能够提高电子病例实体标记的准确率。
本发明的第一方面提供一种电子病例实体标记方法,所述方法包括:
识别历史电子病例中的多个实体;
根据预设实体显示类型显示所述历史电子病例及所述历史电子病例中的所述多个实体;
为每个实体添加锚点,并通过所述锚点接收用户对对应的实体的更新得到更新信息;
将所述历史电子病例及所述历史电子病例中的多个实体及对应的更新信息存储在历史电子病例实体表中;
基于所述历史电子病例实体表训练BiLSTM-CRF模型得到实体标记模型;
使用所述实体标记模型对待标记的电子病例进行实体标记。
根据本发明的一个可选的实施例,所述识别历史电子病例中的多个实体包括:
获取历史电子病例集合;
通过结巴分词工具对所述历史电子病例集合进行分词得到多个词组;
获取对所述多个词组的实体标记;
根据所述多个词组及实体标记构建医疗知识图谱;
采用所述医疗知识图谱识别历史电子病例中的多个实体。
根据本发明的一个可选的实施例,所述根据预设实体显示类型显示所述历史电子病例及所述历史电子病例中的所述多个实体包括:
识别所述历史电子病例中的多个关键字段;
以所述多个关键字段为段落标记对所述历史电子病例进行定位;
获取每个实体对应的显示类型;
根据所述显示类型在所述历史电子病例上对应所述实体的位置添加span标签。
根据本发明的一个可选的实施例,所述为每个实体添加锚点,并通过所述锚点接收用户对对应的实体的更新得到更新信息包括:
为每个实体添加ID并将所述ID作为实体的锚点;
侦测到锚点被选定的指令时,跳转到被选定的锚点对应的目标实体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010917927.7/2.html,转载请声明来源钻瓜专利网。