[发明专利]一种知识图谱构建方法、装置、电子设备及存储介质有效
申请号: | 202210604131.5 | 申请日: | 2022-05-30 |
公开(公告)号: | CN115203428B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 郑烨翰;陆超;蔡远俊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/30 |
代理公司: | 北京易光知识产权代理有限公司 11596 | 代理人: | 王姗姗;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 构建 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种知识图谱构建方法、装置、电子设备及存储介质,涉及知识图谱、自然语言处理、深度学习等人工智能技术领域,可应用于智能创作等场景。具体实现方案为:对第一文档数据进行解析,得到多种类型的待处理数据;将待处理数据与行业样本数据进行匹配,得到与行业样本数据匹配的实体对象,实体对象用于表征行业知识的分类;从待处理数据中提取出与实体对象相关的第一子对象;根据实体对象和第一子对象,构建行业知识图谱。采用本公开,可以降低行业知识图谱的构建成本。
技术领域
本公开涉及人工智能技术领域,尤其涉及知识图谱、自然语言处理、深度学习等领域,可应用于智能创作等场景。
背景技术
知识图谱是人工智能的重要分支技术,知识图谱作为结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,“实体”间通过“关系”相互联结,构成网状的知识结构。
知识图谱按照功能和应用场景可以分为通用知识图谱和行业知识图谱。其中,通用知识图谱面向的是通用领域,强调知识的广度,形态通常为结构化的百科知识,针对的使用者主要为普通用户;而行业知识图谱则面向某一特定领域,强调知识的深度,通常需要基于该行业的数据库进行构建,针对的使用者为行业内的从业人员以及潜在的业内人士等。
相关技术中,要想构建上述行业知识图谱,需要深入理解大量的行业知识,标注大量的专业训练数据,整个构建过程成本高,建设周期长。
发明内容
本公开提供了一种知识图谱构建方法、装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种知识图谱构建方法,包括:
对第一文档数据进行解析,得到多种类型的待处理数据;
将所述待处理数据与行业样本数据进行匹配,得到与所述行业样本数据匹配的实体对象,所述实体对象用于表征行业知识的分类;
从所述待处理数据中提取出与所述实体对象相关的第一子对象;
根据所述实体对象和所述第一子对象,构建行业知识图谱。
根据本公开的另一方面,提供了一种知识图谱构建装置,包括:
解析模块,用于对第一文档数据进行解析,得到多种类型的待处理数据;
匹配模块,用于将所述待处理数据与行业样本数据进行匹配,得到与所述行业样本数据匹配的实体对象,所述实体对象用于表征行业知识的分类;
第一提取模块,用于从所述待处理数据中提取出与所述实体对象相关的第一子对象;
第一构建模块,用于根据所述实体对象和所述第一子对象,构建行业知识图谱。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任意一实施例所提供的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本公开任意一项实施例所提供的方法。
采用本公开,通过对第一文档数据进行解析,可以得到多种类型的待处理数据,将该待处理数据与行业样本数据进行匹配,可以得到与行业样本数据匹配的实体对象,该实体对象用于表征行业知识的分类。从待处理数据中提取出与该实体对象相关的第一子对象,以便根据该实体对象和该第一子对象构建行业知识图谱,从而,可以降低行业知识图谱的构建成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210604131.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板及显示终端
- 下一篇:一种纯肉肠加工工艺及其纯肉肠