[发明专利]一种医疗术语自动标准化方法和装置有效
申请号: | 202110511800.X | 申请日: | 2021-05-11 |
公开(公告)号: | CN112926315B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 王硕;胡可云;陈联忠 | 申请(专利权)人: | 北京嘉和海森健康科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/237 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 骆宗力 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 术语 自动 标准化 方法 装置 | ||
本申请提供一种医疗术语自动标准化方法和装置,通过获取基础数据词汇表,所述基础数据词汇表中具有基础医学词汇;基于所述基础数据词汇表对所需标准化的备选词进行分类;判断隶属于同一类的备选词中有无反义词,当属于同一类的不同备选词之间中具有反义词时,基于所述反义词继续对所述隶属于同一类的备选词进行再次分类;计算隶属于同一类的各个备选词之间的相似度;将相似度大于预设值的各个备选词之间建立同义词关系;确定具有同义词关系的备选词对应的标准词汇,建立所述标准词汇与其对应的备选词之间的映射关系,提高了医疗术语标准化处理的处理效率。
技术领域
本发明涉及人工智能技术领域,具体涉及一种医疗术语自动标准化方法和装置。
背景技术
目前国内各医疗机构使用的医学术语存在大量书写方式不统一的现象,造成信息分隔,为医疗数据的充分利用造成了障碍。现有的国际术语标准体系未能覆盖医疗机构中同一词汇的不同写法,且分类方式并不完全适用基于特定场景的临床产品应用。因此需要建立一套临床标准医学术语体系,来整合医疗数据中的多词一意的情况。由于医疗术语数据量巨大,仅通过人工进行词汇标准化存在耗时久、成本高、容易遗漏的情况。因此,急需一种能够快速对医学术语进行标准化处理的方案。
发明内容
有鉴于此,本发明实施例提供一种医疗术语自动标准化方法和装置,以实现医疗术语自动标准化处理。
为实现上述目的,本发明实施例提供如下技术方案:
一种医疗术语自动标准化方法,包括:
获取基础数据词汇表,所述基础数据词汇表中具有基础医学词汇;
基于所述基础数据词汇表对所需标准化的备选词进行分类;
判断隶属于同一类的备选词中有无反义词,当属于同一类的不同备选词之间中具有反义词时,基于所述反义词继续对所述隶属于同一类的备选词进行再次分类;
计算隶属于同一类的各个备选词之间的相似度;
将相似度大于预设值的各个备选词之间建立同义词关系;
确定具有同义词关系的备选词对应的标准词汇,建立所述标准词汇与其对应的备选词之间的映射关系。
可选的,上述医疗术语自动标准化方法中,还包括:
剔除各类备选词中的无意义词汇,记为修正备选词,确定所述备选词与所述修正备选词之间的映射关系;
计算隶属于同一类的各个备选词之间的相似度,所述将相似度大于预设值的各个备选词之间建立同义词关系,包括:
计算隶属于同一类的各个修正备选词之间的相似度,将相似度大于预设值的各个修正备选词之间建立同义词关系。
可选的,上述医疗术语自动标准化方法中,所述确定具有同义词关系的备选词对应的标准词汇,包括:
判断具有同义词关系的各个备选词是否存在对应的标准词汇,如果存在,将该标准词汇作为所述具有同义词关系的备选词对应的标准词汇,如果不存在,选择具有同义词关系的各个备选词中的一个备选词作为标准词汇。
可选的,上述医疗术语自动标准化方法中,所述基础医学词汇包括:部位、侧别和分型中的一项或多项,所述基础数据词汇表中还存储有基础医学词汇之间的同义词关系。
可选的,上述医疗术语自动标准化方法中,基于所述基础数据词汇表对所需标准化的备选词进行分类,包括:
基于所述基础数据词汇表提取各个所需标准化的备选词中所包含的基础医学词汇;
判断是否存在基础医学词汇全部相同或者是为同义词的备选词,如果是,将该备选词划分为同一类。
一种医疗术语自动标准化装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘉和海森健康科技有限公司,未经北京嘉和海森健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110511800.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:插件处理方法及装置
- 下一篇:嵌入式的任务调度方法、装置、电子设备及存储介质