[发明专利]使用外部数据源扩展知识图在审
申请号: | 202010657144.X | 申请日: | 2020-07-09 |
公开(公告)号: | CN112214583A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | K·克洛特瓦特尔;张哲;张乐;V·维尔马 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 郑宗玉 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 外部 数据源 扩展 知识 | ||
使用外部数据源扩展知识图。提供了从原始知识图中选择原始实体的方法。然后,该方法访问在原始知识图外部的数据源,例如在线百科全书。基于与原始实体匹配的实体来识别数据源中的实体。然后,在数据源中识别在所识别的实体与新实体之间的新关系,其中原始知识图中缺少新实体。然后,生成扩展的知识图,其中扩展知识图是通过将新实体添加到原始知识图而形成的。
背景技术
在计算机科学中,知识图表示通过关系(关联)彼此连接的实体的相互链接的描述的集合。实体可以是现实世界对象、事件、情况或抽象概念。知识图包括具有形式结构的描述,所述形式结构允许计算机进程以有效且明确的方式访问它们。实体描述相互促进,从而形成网络,其中每个实体代表与之相关的实体的描述的一部分。
知识图与本体(ontology)结合使用。本体包含对类别、属性、和概念、数据和实体之间的关系的表示、正式命名和定义,这些概念、数据和实体证实一个或多个或所有话语(discourse)领域。每个领域创建本体以限制复杂性并且将信息组织成数据和知识。随着新本体的产生,它们的使用有望改进该领域内的问题解决。
作为广义的术语,知识图有时被用作本体的同义词。一种常见的解释是,知识图表示实体(现实世界对象、事件、情况或抽象概念)的相互链接的描述的集合。与本体不同,知识图通常包含大量具有较少形式语义的事实信息。在某些上下文中,术语“知识图”用来指代被表示为图的任何知识库。
问题回答(QA)是信息检索和自然语言处理(NLP)领域内的计算机科学学科,它与构建以自然语言回答由人类提出的问题的系统有关。QA实现方式(通常是计算机程序)可以通过查询知识或信息的结构化数据库(通常是知识库或“语料库”)来构造其答案。QA系统可以从自然语言文档(例如在因特网上查找到的文档)的非结构化集合中摄取数据。数据以如下格式被摄取到QA系统的语料库中,该格式使得该数据比必须搜索非结构化文档更容易地可用于QA系统。QA系统可能会摄取和使用的自然语言文档集合的示例可以包括参考文本、组织文档和网页、新闻专线报道、在线百科全书页、以及在因特网上查找到的其他数据页。
QA系统摄取大量文档。这些文档通常包含许多段落。当使用传统的QA流水线来发现对所提交的问题的可能候选答案时,该流水线识别被发现有助于提供对该问题的可能答案的段落。传统系统中的段落仅限于段落中包含的文本或数据,而从处理这样的段落的知识图引擎所得到的任何知识图限于在相应段落中查找到的实体和关系,因此限制了所得到的知识图的潜在有用性。
发明内容
提供了从原始知识图中选择原始实体的方法。然后,该方法访问在原始知识图外部的数据源,例如在线百科全书。基于与原始实体匹配的实体来识别数据源中的实体。然后,在数据源中识别在所识别的实体与新实体之间的新关系,其中在原始知识图中缺少新实体。然后,生成扩展知识图,其中扩展知识图是通过将新实体添加到原始知识图而形成的。
前述内容是概述,并且因此必然包含对详细内容的简化、概括和省略;因此,本领域技术人员将理解,该概述仅是说明性的,而不是旨在以任何方式进行限制。在下面阐述的非限制性详细描述中,本发明的其他方面、创造性特征和优点将是明显的。
附图说明
通过参考附图,可以更好地理解本发明,并且本发明的许多目的、特征和优点对于本领域技术人员而言是明显的,其中:
图1描绘包括利用知识库的知识管理器的网络环境;
图2是诸如图1中所示的信息处理系统的处理器和组件的框图;
图3是示出利用实体关系以使用知识图来发现答案的系统中所包括的各种组件的组件图;
图4是示出用于利用实体关系以使用知识图来发现答案的逻辑的流程图的图示;
图5是示出用于使用来自外部源的数据来扩展知识图的逻辑的流程图的图示;
图6是示出用于计算知识图之间的相似度的逻辑的流程图的图示;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010657144.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于反馈的通信路由器
- 下一篇:从图像中检测和预测对象事件