[发明专利]基于异构图神经网络的医疗术语规范化系统及方法有效
申请号: | 202111213727.4 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113656604B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 李劲松;杨宗峰;辛然;田雨;周天舒 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/194;G06F40/30;G16H50/70;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 构图 神经网络 医疗 术语 规范化 系统 方法 | ||
本发明公开了一种基于异构图神经网络的医疗术语规范化系统及方法,首先对各种类型的医疗术语构建关键的信息单元,实现医疗术语的结构化表示,并基于信息单元构建包含各种类型医疗术语的知识图谱。基于此知识图谱构建包含各种类型医疗术语的异构图神经网络,在异构图神经网络的训练过程中综合考虑图的临近节点分布和节点内容编码,用于进行医疗术语规范化。本发明能够充分利用同类医疗术语的信息单元互相之间关联与差异的知识,同时容纳各种类型的医疗术语,能够全面学习医疗领域的知识,并且能够方便地将新类型的医疗术语增加到系统中,减少了新类型医疗术语规范化的工作量。
技术领域
本发明属于中文医学术语标准化及多中心医学信息平台技术领域,尤其涉及一种基于异构图神经网络的医疗术语规范化系统及方法。
背景技术
医疗信息化进程中一个重要的研究方向就是将更高性能的机器学习和人工智能技术应用于解决实际的临床问题。人工智能技术的一个优点是可以从海量数据中发现复杂的规律和特征,因此综合利用多家医疗机构的医疗数据进行分析挖掘和模型设计,进而为医疗研究、临床决策工作提供支持成为医疗信息化的必然趋势。而由于不同医疗机构采用的信息标准众多,并且经常会人为地产出半结构化和非结构化的数据,导致整合利用不同来源的医疗数据变得异常困难。医疗术语是组成医疗数据的基础要素,建立完善的医疗术语规范化体系可以将不同来源的医疗数据对齐到统一的标准和结构,进而为临床决策和医疗研究工作提供更大规模和更高质量的数据。医疗术语主要包括临床操作过程中产生的药物、医学检查、疾病等类型的术语。不同类型的医疗术语会包含特定的关键维度的信息,我们将其定义为医疗术语的信息单元。例如,药物术语“5%葡萄糖注射液(基)500毫升”包含如表1所示的信息单元:
表1 药物术语信息单元示例
检查术语“左手指正侧位_X”包含如表2所示的信息单元:
表2 检查术语信息单元示例
某些信息单元由其它更细粒度的信息单元组成,分别将其定义为一级信息单元和二级信息单元,例如表1中药物术语包含一级信息单元“药物成分”、“药物剂型”、“药物剂量”和“药物规格”,其中“药物规格”信息单元由二级信息单元“数值”(500)和“计量单位”(毫升)组成。给定一组医疗术语的信息单元即可确定一条完整的医疗术语。
在实际临床操作中由于各医疗机构采用的信息标准差异和医护人员个人习惯差异等原因,会产生大量不规范的医疗术语,主要表现为关键信息单元的冗余或缺失、表达方式不规范、数量单位不统一等问题,例如下列药物术语的含义完全相同,但是形式上差异较大:“左氧氟沙星片(可乐必妥)500毫克”和“可乐必妥 0.5g/片”。医疗术语规范化的目标就是识别出含义完全相同但字面形式不同的医疗术语,以便统一它们的表达方式,同时区分出含义不同的医疗术语,最终促进医疗数据整体的规范化。
传统的医疗术语规范化方法是针对某个单一类别的医疗术语,通过机器学习或人工校验的方法来理解每条医疗术语的含义,标注出语义相同的医疗术语。这样的方法将每条医疗术语作为一个整体,忽略了医疗术语内部固有的信息单元的结构,主要的缺点是:(1)无法有效地利用信息单元互相之间关联与差异的知识。同一条医疗术语的不同维度的信息单元之间的关联和差异会包含丰富的医疗领域知识,而现有的做法没有显式地对这些知识进行结构化表示和利用;(2)不同类型的医疗术语会包含相同或有关联的信息单元,而过去的医疗术语规范化工作都是针对单一类别的医疗术语分别开发独立的系统,这样做一方面工作量过大,另一方面也无法综合利用不同类型医疗术语的信息单元中的知识;(3)会将多余的信息纳入考虑范围。由于表达不规范等原因,大多数医疗术语除了关键的信息单元之外,还会包含一些多余的字符,这些字符与医疗术语整体的含义几乎没有关联,而且作为噪声会使医疗术语的含义产生偏差。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111213727.4/2.html,转载请声明来源钻瓜专利网。