[发明专利]基于深度学习的知识图谱构建方法、设备及存储介质有效
申请号: | 202110902458.6 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113722501B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 李劲;齐文;郭玮;苏力强 | 申请(专利权)人: | 深圳清华大学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06N3/088 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 廖慧贤 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 知识 图谱 构建 方法 设备 存储 介质 | ||
本发明公开了一种基于深度学习的知识图谱构建方法、设备及存储介质,基于深度学习的知识图谱构建方法包括:获取已构建知识图谱,并提取已构建知识图谱中的第一实体信息;采集第一实体信息在已构建知识图谱中相关的信息以得到数据集合;获取数据集合中与第一实体信息相关的多个自然段语句;根据预设非监督深度学习模型将多个自然段语句进行分类以得到多个分类结果;获取多个分类结果中分类结果符合预设条件的自然段语句以得到相关性语句,并根据相关性语句增加已构建知识图谱中与第一实体信息对应的第二实体信息、关系信息。本发明根据新获得的第二实体信息、关系信息修改已构建知识图谱,从而得到更加准确和完整的知识图谱。
技术领域
本发明涉及深度学习的技术领域,尤其是涉及一种基于深度学习的知识图谱构建方法、设备及存储介质。
背景技术
知识图谱(Knowledge Graph)通常指可揭示实体之间的关系的语义网络,其基于数据挖掘、信息处理、图形绘制等手段,利用可视化的图谱将复杂的知识领域形象地展示出来,可在一定程度上体现知识领域的发展规律。
随着大数据时代的发展,人们对于知识图谱的要求不再是简单的关系链,对知识图谱的完备度、准确性也有了较高的要求,但是相关技术中的知识图谱构建成本高且完备性较难保证,导致知识推理计算的准确度较低。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于深度学习的知识图谱构建方法,能够提高知识图谱的完整性和准确性。
本发明还提出一种电子控制设备。
本发明还提出一种计算机可读存储介质。
第一方面,本发明的一个实施例提供了基于深度学习的知识图谱构建方法,包括:
获取已构建知识图谱,并提取所述已构建知识图谱中的第一实体信息;
采集所述第一实体信息在所述已构建知识图谱中相关的信息以得到数据集合;
获取所述数据集合中与所述第一实体信息相关的多个自然段语句;
根据预设非监督深度学习模型将多个所述自然段语句进行分类以得到多个分类结果;
获取多个所述分类结果中所述分类结果符合预设条件的所述自然段语句以得到相关性语句,并根据所述相关性语句增加所述已构建知识图谱中与所述第一实体信息对应的第二实体信息、关系信息。
本发明实施例的基于深度学习的知识图谱构建方法至少具有如下有益效果:根据新获得的第二实体信息、关系信息修改已构建知识图谱中第一实体信息的关系结构,以不断完善已构建知识图谱,从而得到更加准确和完整的知识图谱。
根据本发明的另一些实施例的基于深度学习的知识图谱构建方法,所述根据预设非监督深度学习模型将多个所述自然段语句进行分类以得到多个分类结果,包括:
所述预设非监督深度学习模型将多个所述自然段语句拆分为预设模式结构以得到语句模式结构,所述预设模式结构为第一实体信息和/或关系信息和/或第二实体信息;
根据所述预设非监督深度学习模型计算所述语句模式结构和所述第一实体信息的可信度;
根据所述多个自然段语句的语句模式结构以及对应的所述可信度确定所述分类结果。
根据本发明的另一些实施例的基于深度学习的知识图谱构建方法,所述预设条件包括:基准模式结构、预设可信度阈值。
根据本发明的另一些实施例的基于深度学习的知识图谱构建方法,还包括:
若所述自然段语句的所述语句模式结构不符合所述基准模式结构,和/或所述可信度低于所述预设可信度阈值,则将对应的所述自然段语句剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳清华大学研究院,未经深圳清华大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110902458.6/2.html,转载请声明来源钻瓜专利网。