[发明专利]基于深度学习的知识图谱构建方法、设备及存储介质有效
申请号: | 202110902458.6 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113722501B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 李劲;齐文;郭玮;苏力强 | 申请(专利权)人: | 深圳清华大学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06N3/088 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 廖慧贤 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 知识 图谱 构建 方法 设备 存储 介质 | ||
1.一种基于深度学习的知识图谱构建方法,其特征在于,包括:
获取已构建知识图谱,并提取所述已构建知识图谱中的第一实体信息;
采集所述第一实体信息在所述已构建知识图谱中相关的信息以得到数据集合;
获取所述数据集合中与所述第一实体信息相关的多个自然段语句;
根据预设非监督深度学习模型将多个所述自然段语句进行分类以得到多个分类结果,具体包括:
所述预设非监督深度学习模型将多个所述自然段语句拆分为预设模式结构以得到语句模式结构,所述预设模式结构为第一实体信息和/或关系信息和/或第二实体信息;
根据所述预设非监督深度学习模型计算所述语句模式结构和所述第一实体信息的可信度;
根据所述多个自然段语句的所述语句模式结构以及对应的所述可信度确定所述分类结果;
获取多个所述分类结果中所述分类结果符合预设条件的所述自然段语句以得到相关性语句,并根据所述相关性语句增加所述已构建知识图谱中与所述第一实体信息对应的第二实体信息、关系信息。
2.根据权利要求1所述的基于深度学习的知识图谱构建方法,其特征在于,所述预设条件包括:基准模式结构、预设可信度阈值。
3.根据权利要求2所述的基于深度学习的知识图谱构建方法,其特征在于,还包括:
若所述自然段语句的所述语句模式结构不符合所述基准模式结构,和/或所述可信度低于所述预设可信度阈值,则将对应的所述自然段语句剔除。
4.根据权利要求2或3所述的基于深度学习的知识图谱构建方法,其特征在于,所述获取多个所述分类结果中所述分类结果符合预设条件的所述自然段语句以得到相关性语句,并根据所述相关性语句增加所述已构建知识图谱中与所述第一实体信息对应的第二实体信息、关系信息,包括:
获取所述语句模式结构符合所述基准模式结构,且所述可信度大于所述预设可信度阈值的所述自然段语句以得到所述相关性语句;
根据所述相关性语句增加所述已构建知识图谱中与所述第一实体信息对应的第二实体信息、关系信息。
5.根据权利要求4所述的基于深度学习的知识图谱构建方法,其特征在于,所述根据所述相关性语句增加所述已构建知识图谱中与所述第一实体信息对应的第二实体信息、关系信息,包括:
提取所述相关性语句中与所述第一实体信息不同的所述第二实体信息;
提取所述相关性语句中与所述第一实体信息、所述第二实体信息关联的所述关系信息;
将提取的所述第二实体信息、所述关系信息增加到所述已构建知识图谱中的所述第一实体信息的图谱结构中。
6.根据权利要求4所述的基于深度学习的知识图谱构建方法,其特征在于,还包括:
采集符合所述基准模式结构的语句以得到语料训练集合;
将所述语料训练集合代入所述预设非监督深度学习模型以调节所述预设非监督深度学习模型的参数以得到优化后的所述预设非监督深度学习模型。
7.根据权利要求1所述的基于深度学习的知识图谱构建方法,其特征在于,所述预设非监督深度学习模型为屏蔽语言模型。
8.一种电子控制设备,其特征在于,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7任一项所述的基于深度学习的知识图谱构建方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的基于深度学习的知识图谱构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳清华大学研究院,未经深圳清华大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110902458.6/1.html,转载请声明来源钻瓜专利网。