[发明专利]一种专病知识图谱构建方法及装置有效
申请号: | 201910561727.X | 申请日: | 2019-06-26 |
公开(公告)号: | CN110222201B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 李姣;覃露;徐晓巍 | 申请(专利权)人: | 中国医学科学院医学信息研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/951;G06F16/953;G06F16/83;G16H50/70 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张雪娇 |
地址: | 100020*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种专病知识图谱构建方法及装置,该方法在构建专病知识体系的基础上,利用预先构建的实体抽取模型进行医学实体信息的抽取,并进一步基于所述专病知识体系进行医学实体的属性信息及关系信息的抽取,最终基于所抽取的各项信息构建专病知识图谱,其中,所述实体抽取模型为基于预先标注的训练数据集所训练的模型,且所述训练数据集通过使用医学词表匹配结合人工审核、标注的方式构造得到。本申请在医学实体抽取中,通过使用医学词表匹配结合人工审核、标注的方式构造实体抽取模型训练时所需的训练数据集,可以减小构造训练数据集的工作量,降低了对人力资源及时间资源的消耗,同时还可提升专病知识图谱的构建效率及知识合理性。 | ||
搜索关键词: | 一种 知识 图谱 构建 方法 装置 | ||
【主权项】:
1.一种专病知识图谱构建方法,其特征在于,包括:构建专病知识体系;基于所述专病知识体系,利用预先构建的实体抽取模型进行医学实体信息的抽取;所述实体抽取模型为基于预先标注的训练数据集所训练的模型,所述训练数据集基于如下处理方式得到:采用医学词表匹配的方式对医学文本进行实体信息标注,并基于人工方式对词表匹配结果进行审核和再标注;基于所述专病知识体系,进行医学实体的属性信息的抽取;基于所述专病知识体系,进行医学实体与医学实体之间的关系信息和/或医学实体与医学实体的属性之间的关系信息的抽取;基于所抽取的医学实体信息、属性信息及关系信息,构建专病知识图谱。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院医学信息研究所,未经中国医学科学院医学信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910561727.X/,转载请声明来源钻瓜专利网。