[发明专利]医学名称归一化方法、装置、存储介质及终端有效
申请号: | 202010633727.9 | 申请日: | 2020-07-02 |
公开(公告)号: | CN111859942B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 薛颜波;顾根;刘霄晨 | 申请(专利权)人: | 上海森亿医疗科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/31;G06F16/332 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 倪静 |
地址: | 201213 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医学 名称 归一化 方法 装置 存储 介质 终端 | ||
本发明提供一种医学名称归一化方法、装置、存储介质及终端。所述医学名称归一化方法包括:对医学标准词表中的每个标准词条进行第一阶段的拆解,得到每个标准词条所对应的多个医学属性;为每个标准词条构建相应的属性表达式;对所述每个标准词条进行第二阶段拆解,得到每个医学属性下的多个子属性;获取待归一的医学名称所对应的多个医学属性及每个医学属性下的多个子属性;将所述待归一的医学名称的多个子属性与标准词条的多个子属性进行表达式匹配计算;输出符合匹配要求的所述待归一的医学名称所对应的标准词条。本发明适用于复杂应用场景,极大降低了医学名称归一化的人力成本,提高了医学名称归一化的效率与准确率。
技术领域
本发明涉及医学信息处理领域,特别是涉及医学名称归一化方法、装置、存储介质及终端。
背景技术
医疗行业是数据密集型的行业,该行业无论是公共卫生、临床服务还是医学研究,都离不开数据的支撑。在医疗大数据平台建设过程中,需要对海量的医疗数据进行标准化处理,才能充分利用数据价值。但是,目前我国的医疗数据缺乏统一的标准规范,各个地区甚至各个医院都未使用统一的数据标准,严重影响了医疗大数据平台的数据质量和数据治理效果。
我国不同地区甚至不同医院对于同一检查指标均存在不同的检验名称,仅以“血清钠”为例,就包括“钠离子浓度”、“NA+”、“动脉血钠”和“血钠(Na)”等十多种不同的名称。为解决上述医学检验名称差异带来的医疗数据治理难度大、数据质量低的问题,现阶段的基本方法是收集每种检验名称的同义词,通过建立同义词词表进行映射。但是,这种方法仅适用于简单场景,当外部输入检验文本稍微复杂时就会失效。例如,外部输入检验文本中若包含检验名称和样本来源或者其他信息字段时,某个检验名称为“α1微球蛋白/24h”,额外单位信息为“mg/24h”,需要获得准确词条“尿24小时微量白蛋白含量测定(24小时微量白蛋白)”,如果仅依靠同义词匹配,只能获得“尿微量白蛋白定量”这个词条。因此,上述方法得出的结果无法满足实际应用场景。
除上述同义词词表的方法之外,还可以采取的方法有:建立标准词表,并预先定义标准词条的主属性和次要属性类别(类别数量确定,类别举例如下:“主诊断词”、“主解剖部位”、“次解剖部位”、“分型”、“病理”等),当外部输入检验文本全部满足主属性和所有次要属性类别条件时输出正确答案。这种方法的缺点如下:1)预先为标准词条定义固定数量的属性,当遇到复杂标准词条,原有属性数量不够用时,无法正确定义并准确输出该标准词条,会影响最终归一化效果2)判断标准词条的方法过于单一,仅考虑同时满足主属性和所有次要属性的包含条件,未考虑到各种属性之间的相关性、互斥性、顺序性等各种组合情况以及权重分配问题,不够灵活和通用。
因此,亟需提出一种适用于复杂场景的具有更高的灵活性和通用性的医学名称归一化方法,以提高医学大数据平台的数据质量和数据治理效果。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供医学名称归一化方法、装置、存储介质及终端,用于解决现有技术中的医学名称归一化方法灵活性和通用性不够高,无法满足实际应用需要的问题。
为实现上述目的及其他相关目的,本发明的第一方面提供一种医学名称归一化方法,包括:对医学标准词表中的每个标准词条进行第一阶段的拆解,以拆解得到每个标准词条所对应的多个医学属性;根据每个标准词条所对应的多个医学属性,为每个标准词条构建相应的属性表达式;对所述每个标准词条进行第二阶段拆解,以拆解得到每个医学属性下的多个子属性;获取待归一的医学名称所对应的多个医学属性及每个医学属性下的多个子属性;将所述待归一的医学名称的多个子属性与标准词条的多个子属性进行表达式匹配计算;根据计算结果,输出符合匹配要求的所述待归一的医学名称所对应的标准词条。
于本发明的第一方面的一些实施例中,所述方法还包括:当所述待归一的医学名称所对应的标准词条不唯一时,对所述标准词条进行过滤和筛选,以获取待归一的医学名称所对应的唯一标准词条。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海森亿医疗科技有限公司,未经上海森亿医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010633727.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:检测方法、电子设备及存储介质
- 下一篇:一种组合式计算机外接设备收纳装置