[发明专利]值域数据匹配方法、装置、存储介质及电子设备在审
申请号: | 202110120997.4 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112818085A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 冯仓龙 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G16H70/00 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 张桂杰 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 值域 数据 匹配 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种值域数据匹配方法、装置、存储介质及电子设备,以对医疗数据中的疾病名称进行更准确的值域匹配。该值域数据匹配方法包括:从医疗数据中获取待匹配疾病名称;确定所述待匹配疾病名称所属的疾病类别,并根据所述疾病类别包括的标准疾病名称,确定所述待匹配疾病名称对应的第一候选疾病名称;将所述待匹配疾病名称输入语义相似度模型,以得到所述待匹配疾病名称对应的第二候选疾病名称,所述语义相似度模型是根据样本疾病名称的词性特征和句法特征进行训练而得到的;根据所述第一候选疾病名称和所述第二候选疾病名称,确定所述待匹配疾病名称对应的值域匹配结果。
技术领域
本公开涉及数据处理技术领域,具体地,涉及一种值域数据匹配方法、装置、存储介质及电子设备。
背景技术
在医疗数据领域,值域数据是指具有映射关系的医疗数据集合,包括小值域数据和大值域数据。其中,小值域数据是指种类较少、数据组织简单的值域数据,例如医保类别、患者性别等。大值域数据是指种类较多、数据组织复杂的值域数据,例如手术名称、疾病名称等。
由于不同医疗信息系统的数据结构不同、医疗信息系统的用户对于同一数据的数据表达不同等原因,如果要对医疗数据进行统一的分析和管理,则需要对医疗数据进行标准化操作。其中,值域数据的标准化操作主要是通过模糊查询、分词比较等值域匹配的方式进行。
但是,对于字符较少的值域数据,相关技术中的值域匹配方式难以实现较好的数据标准化效果。比如,疾病名称多以短文本或是名词短语构成,具有专业表示性强、缺少上下文信息、供拆解的信息少等特点,因此通过相关技术中的值域匹配方式对疾病名称进行数据标准化,难以得到较好的数据标准化效果,从而影响后续的统一分析和管理。
发明内容
本公开的目的是提供一种值域数据匹配方法、装置、存储介质及电子设备,以对医疗数据中的疾病名称进行更准确的值域匹配。
为了实现上述目的,第一方面,本公开提供一种值域数据匹配方法,所述方法包括:
从医疗数据中获取待匹配疾病名称;
确定所述待匹配疾病名称所属的疾病类别,并根据所述疾病类别包括的标准疾病名称,确定所述待匹配疾病名称对应的第一候选疾病名称;
将所述待匹配疾病名称输入语义相似度模型,以得到所述待匹配疾病名称对应的第二候选疾病名称,所述语义相似度模型是根据样本疾病名称的词性特征和句法特征进行训练而得到的;
根据所述第一候选疾病名称和所述第二候选疾病名称,确定所述待匹配疾病名称对应的值域匹配结果。
可选地,所述方法还包括:
基于疾病的发病部位和病理对国际疾病分类表中各疾病名称进行分类,以得到疾病分类表;
所述确定所述待匹配疾病名称所属的疾病类别,包括:
基于所述待匹配疾病名称在所述疾病分类表中进行查找,以确定所述待匹配疾病名称所属的疾病类别。
可选地,所述基于疾病的发病部位和病理对国际疾病分类表中各标准疾病名称进行分类,以得到疾病分类表,包括:
基于疾病的病理对国际疾病分类表中各疾病名称进行分类,以得到第一疾病分类表,并基于疾病的发病部位对国际疾病分类表中各疾病名称进行分类,以得到第二疾病分类表;
所述确定所述待匹配疾病名称所属的疾病类别,包括:
基于所述待匹配疾病名称在所述第一疾病分类表中进行查找;
若在所述第一疾病分类表中未查找到所述待匹配疾病名称所属的疾病类别,则基于所述待匹配疾病名称在所述第二疾病分类表中进行查找,并根据在所述第二疾病分类表中查找到的疾病类别,确定所述待匹配疾病名称所属的疾病类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110120997.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置