[发明专利]医学数据标注方法、装置、存储介质及计算机设备有效
申请号: | 202010181144.7 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111444686B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 李然;沈宏;李蕊 | 申请(专利权)人: | 武汉中科医疗科技工业技术研究院有限公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/295;G06F40/284 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 孙岩 |
地址: | 430206 湖北省武汉市东湖新技*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学 数据 标注 方法 装置 存储 介质 计算机 设备 | ||
本申请涉及一种医学数据标注方法、装置、存储介质及计算机设备,在进行医学数据标注时,在通过对医学数据进行编码处理得到最低粒度的数据对应的字向量之后,还包括对具备医学相关性的相邻数据对应的相邻字向量进行组合处理的步骤,从而可以得到不同粒度任务级别的字向量组合,然后通过标注模型对字向量以及字向量组合进行标注,可以使得得到的医学属性类别标注结果包含不同粒度数据的标注结果,从而使得标注结果更全面,有利于电子病历的数据挖掘分析。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种医学数据标注方法、装置、存储介质及计算机设备。
背景技术
随着电子技术的发展,电子病历在各大医院的应用越来越普及,不同于传统的纸质病历,电子病历便于储存和管理。电子病历一般存储有病患的疾病症状、诊断经过等与临床治疗相关的重要信息,它与病患的健康有着紧密的联系,因此对电子病历的数据挖掘和分析在近年来受到了广泛的关注,而命名实体识别(即识别电子病历中的数据的医学属性类别,如发病部位、发病症状、治疗手段等)的研究作为自然语言处理的一个重要的基础任务,有着重要的意义。
现有技术中,通常使用网络模型进行命名实体识别工作。用户通过样本数据对初始模型进行训练,得到可以用于进行命名实体识别的网络模型,然后通过该网络模型对新的电子病历进行识别标注。然而,现有技术在模型训练时都只是针对命名实体识别任务进行训练,得到的模型只能提取样本实体粒度的信息,而无法有效提取样本其他粒度的信息,如字符粒度,句子粒度,或者文本粒度的信息,从而使得标注结果不全面,不利于电子病历的数据挖掘分析。
发明内容
基于此,有必要针对现有技术存在的问题,提供一种有助于提高标注结果的全面性的医学数据标注方法、装置、存储介质及计算机设备。
一种医学数据标注方法,包括:
获取待标注的医学数据以及预先训练的标注模型;
对所述医学数据进行编码处理,得到所述医学数据中最低粒度的数据对应的字向量,并对具备医学相关性的相邻数据对应的相邻字向量进行组合处理,得到不同粒度的字向量组合;
通过所述标注模型对各所述字向量以及各所述字向量组合进行数据属性类别标注,得到所述医学数据的医学属性类别标注结果。
一种医学数据标注装置,包括:
获取模块,用于获取待标注的医学数据以及预先训练的标注模型;
编码模块,用于对所述医学数据进行编码处理,得到所述医学数据中最低粒度的数据对应的字向量,并对具备医学相关性的相邻数据对应的相邻字向量进行组合处理,得到不同粒度的字向量组合;
标注模块,用于通过所述标注模型对各所述字向量以及各所述字向量组合进行数据属性类别标注,得到所述医学数据的医学属性类别标注结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中科医疗科技工业技术研究院有限公司,未经武汉中科医疗科技工业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010181144.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置