[发明专利]一种基于电子病历的医学知识图谱构建方法及装置有效
申请号: | 201910598980.2 | 申请日: | 2019-07-04 |
公开(公告)号: | CN110427491B | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 胡茜;柯登峰;刘宁;王静;吴志超 | 申请(专利权)人: | 北京爱医生智慧医疗科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/253;G06F40/295;G06F40/30;G16H10/60 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 苗晓静 |
地址: | 102206 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电子 病历 医学知识 图谱 构建 方法 装置 | ||
本发明实施例提供了一种基于电子病历的医学知识图谱构建方法及装置,方法包括:在电子病历中以身体部位为锚点抽取症状实体;为所述症状实体构建症状与症状细节的二元实体对;为所述二元实体对确定对应的关系类型;以所述二元实体对中的两个实体为节点,以所述二元实体对的关系类型为边,构建医学知识图谱。本发明实施例在电子病历中以身体部位为锚点抽取症状实体,因此可以得到较为全面的症状实体抽取结果,从而提高了医学知识图谱中症状实体的完备性,进而提高了医学知识图谱的参考价值。此外,本发明还构建了症状与症状细节的二元实体对以及对应的关系类型,从而可以根据医学知识图谱分析症状与症状细节之间的医学对应关系。
技术领域
本发明实施例涉及计算机技术领域,具体涉及一种基于电子病历 的医学知识图谱构建方法及装置。
背景技术
知识图谱相对于传统的知识表示,具有语义丰富、结构友好、海 量规模、质量精良等特点,将医学知识表现在知识图谱中,可以利用 知识图谱的优点及相关的技术进行疾病推理应用。
目前在基于电子病历的医学知识图谱构建过程中,存在症状实体 提取不准、漏提或错提的问题,进而影响后续构建的医学知识图谱的 数据完备性,进而降低了医学知识图谱的参考价值。
发明内容
针对现有技术中的问题,本发明实施例提供一种基于电子病历的 医学知识图谱构建方法及装置。
第一方面,本发明实施例提供了一种基于电子病历的医学知识图 谱构建方法,包括:
在电子病历中以身体部位为锚点抽取症状实体;
为所述症状实体构建症状与症状细节的二元实体对;
为所述二元实体对确定对应的关系类型;
以所述二元实体对中的两个实体为节点,以所述二元实体对的关 系类型为边,构建医学知识图谱。
进一步地,所述在电子病历中以身体部位为锚点抽取症状实体, 具体包括:
对电子病历进行分句、分词、词性标注、依存句法分析和语义角 色标注;
在句子中找到表示身体部位的词或词组并以此为锚点,再根据依 存句法分析结果,找到和身体部位上下关联的词或词组,将表示身体 部位的词或词组与和身体部位上下关联的词或词组组成新的词组,并 将所述新的词组作为症状实体。
进一步地,所述为所述症状实体构建症状与症状细节的二元实体 对,具体包括:
根据句子中核心谓语与语义角色标注结果构建症状与症状细节的 二元实体对。
进一步地,所述为所述症状实体构建症状与症状细节的二元实体 对,具体包括:
根据句子中核心谓语与语义角色标注结果确定症状细节,然后再 根据依存句法分析结果分析所述症状细节所描述的症状,最后将所述 症状细节和所述症状组成二元实体对。
进一步地,在根据依存句法分析结果找不出所述症状细节所描述 的症状时,采用就近原则,选择与当前症状细节左边距离最近的症状 作为对应症状,然后将所述症状细节与对应症状组成二元实体对。
进一步地,所述为所述二元实体对确定对应的关系类型,具体包 括:
根据预先定义的关系抽取规则,以及,所述实体对中的症状细节 实体和症状实体,以及,包含所述症状细节实体和所述症状实体的句 子中出现的用于表示所述症状细节实体和所述症状实体之间关系的关 系词,根据规则匹配的方法确定与所述二元实体对对应的关系类型。
进一步地,在所述在电子病历中以身体部位为锚点抽取症状实体 之后,以及,在所述为所述症状实体构建症状与症状细节的二元实体 对之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱医生智慧医疗科技有限公司,未经北京爱医生智慧医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910598980.2/2.html,转载请声明来源钻瓜专利网。