[发明专利]医疗知识图谱的构建方法及装置有效
申请号: | 201910763588.9 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110704631B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 齐振宇;徐波 | 申请(专利权)人: | 北京紫冬认知科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G16H10/60 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 王卫忠 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 知识 图谱 构建 方法 装置 | ||
本发明实施例涉及一种医疗知识图谱的构建方法及装置,所述方法包括:依据多个数据源获取医疗文本数据;对所述医疗文本数据进行知识抽取,形成医疗知识数据;将所述医疗知识数据输入图谱树中,生成医疗知识图谱。由此,可以实现准确地生成医疗知识图谱。
技术领域
本发明实施例涉及知识图谱技术领域,尤其涉及一种医疗知识图谱的构建方法及装置。
背景技术
知识图谱作为支撑人工智能系统的重要基础设施,是决定人工智能系统“性能”和“智能化”程度的核心要素之一,因此,知识图谱的构建和应用具有非常重要的价值。
目前,利用现有的知识图谱构建方法在构建医疗知识图谱时存在以下两个问题:其一,医学知识数量巨大而又复杂,现有方法中知识体系通常表示为“实体-关系-实体”三元组,其无法有效地对医疗知识进行组织和表示;其二,现有方法中主要是从非结构化文本中针对给定关系抽取“实体-关系-实体”三元组,这也就大大限制了医疗知识的来源。由此可见,现有方法中无法实现准确地生成医疗知识图谱。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种医疗知识图谱的构建方法及装置,以实现准确地生成医疗知识图谱。
第一方面,本发明实施例提供一种医疗知识图谱的构建方法,包括:
依据多个数据源获取医疗文本数据;
对所述医疗文本数据进行知识抽取,形成医疗知识数据;
将所述医疗知识数据输入图谱树中,生成医疗知识图谱。
在一个可能的实施方式中,所述多个数据源至少包括:网络数据源、诊疗数据源、医学专业书籍数据源。
在一个可能的实施方式中,所述对所述医疗文本数据进行知识抽取,形成医疗知识数据,包括:
当所述医疗文本数据的类型为结构化数据时,从所述医疗文本数据中抽取属性名称和属性值;
依据所述属性名称和所述属性值构建三元组知识数据;
将所述三元组知识数据作为所述医疗知识数据。
在一个可能的实施方式中,所述对所述医疗文本数据进行知识抽取,形成医疗知识数据,包括:
当所述医疗文本数据的类型为半结构化数据时,依据所述医疗文本数据构建知识抽取模板;
利用所述知识抽取模板从所述医疗文本数据中抽取属性名称和属性值;
依据所述属性名称和所述属性值构建三元组知识数据;
将所述三元组知识数据作为所述医疗知识数据。
在一个可能的实施方式中,所述对所述医疗文本数据进行知识抽取,形成医疗知识数据,包括:
当所述医疗文本数据的类型为非结构化数据时,将所述医疗文本数据转化为句子集合;
依据预设词表对所述句子集合中的每一句子进行命名实体识别;
依据命名实体识别后的句子集合构建知识抽取模板;
利用所述知识抽取模板从所述医疗文本数据中抽取属性名称和属性值;
依据所述属性名称和所述属性值构建三元组知识数据;
将所述三元组知识数据作为所述医疗知识数据。
在一个可能的实施方式中,还包括:
将从所述医疗文本数据中抽取的属性名称和属性值添加至所述预设词表。
在一个可能的实施方式中,所述图谱树通过以下方式构建:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京紫冬认知科技有限公司,未经北京紫冬认知科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910763588.9/2.html,转载请声明来源钻瓜专利网。