[发明专利]用于医学知识图谱的处理方法和装置在审
申请号: | 202011415694.7 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112541354A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 李陶;郑宇宏;徐伟建;曾启飞;纪登林 | 申请(专利权)人: | 百度国际科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F40/211;G06F16/36;G16H10/60;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 医学知识 图谱 处理 方法 装置 | ||
本申请公开了一种用于医学知识图谱的处理方法,涉及人工智能领域,可用于知识图谱、深度学习、自然语言处理等领域。具体实现方案为:从医学文本中提取医学实体;利用通过迁移学习得到的医学实体模型对医学实体进行识别,得到对应的识别结果;以及响应于识别结果表征医学实体为既有标准实体的别名,在医学知识图谱中增加医学实体并针对医学实体增加对应的别名属性信息。
技术领域
本申请涉及人工智能领域,可以用于知识图谱、迁移学习、自然语言处理等领域,更具体地,涉及一种用于医学知识图谱的处理方法和装置、一种用于医学实体模型的训练方法和装置、一种电子设备和存储介质。
背景技术
随着电子病历的普及,医学知识图谱的应用越来越广泛。受地域、医学知识水平等影响,同一医学实体往往有多种不同名称和表述。基于电子病历等医学文本可以识别医学实体别名以及新增医学实体,进而可以扩充既有医学知识图谱。反过来,通过扩充医学知识图谱也可以对电子病历进行有效质控。
发明内容
本申请提供了一种用于医学知识图谱的处理方法和装置、一种用于医学实体模型的训练方法和装置、一种电子设备以及存储介质。
根据第一方面,提供了一种用于医学实体模型的训练方法,包括:针对医学实体识别任务,获取训练数据集;获取针对其他任务训练得到的网络模型,其中所述网络模型与所述医学实体模型具有相同的底层逻辑;以及基于所述训练数据集在所述网络模型基础上进行训练,以得到所述医学实体模型。
根据第二方面,提供了一种用于医学实体模型的训练装置,包括:第一获取模块,用于针对医学实体识别任务,获取训练数据集;第二获取模块,用于获取针对其他任务训练得到的网络模型,其中所述网络模型与所述医学实体模型具有相同的底层逻辑;以及训练模块,用于基于所述训练数据集在所述网络模型基础上进行训练,以得到所述医学实体模型。
根据第三方面,提供了一种用于医学知识图谱的处理方法,包括:从医学文本中提取医学实体;利用通过迁移学习得到的医学实体模型对所述医学实体进行识别,得到对应的识别结果;以及响应于所述识别结果表征所述医学实体为既有标准实体的别名,在所述医学知识图谱中增加所述医学实体并针对所述医学实体增加对应的别名属性信息。
根据第四方面,提供了一种用于医学知识图谱的处理装置,包括:提取模块,用于从医学文本中提取医学实体;识别模块,用于利用通过迁移学习得到的医学实体模型对所述医学实体进行识别,得到对应的识别结果;以及知识图谱处理模块,用于响应于所述识别结果表征所述医学实体为既有标准实体的别名,在所述医学知识图谱中增加所述医学实体并针对所述医学实体增加对应的别名属性信息。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行本申请实施例的方法。
根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,包括:上述计算机指令用于使上述计算机执行本申请实施例的方法。
根据第七方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本申请实施例的上述方法。
根据本申请实施例提供的技术方案,采用迁移学习的方式获取医学实体模型,仅需要少量的训练数据来进行模型训练,因而不需要大量的标注数据,进而可以节约成本,同时还可以提高模型训练效率和模型的识别能力。并且,当前很难有足够的医学知识和已标注正确的语料进行全量训练,而借用之前模型的结果进行迁移学习可以解决该问题。此外,通过本申请实施例,还可以扩充原标准库中的医学实体数量,同时还可以获取部分实体在临床电子病历中使用的医学实体别名,并将这部分数据回流至总医学知识图谱中,增加图谱中别名属性的覆盖率。此外,还可以将医学知识图谱用于质控,如在生成电子病历过程中,判断医生的诊断是否准确、下药是否合理,等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度国际科技(深圳)有限公司,未经百度国际科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011415694.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车用燃油泵支架总成
- 下一篇:一种机载娱乐数据包加载系统