[发明专利]用于问答系统的插入和摄取框架有效
申请号: | 202010082280.0 | 申请日: | 2020-02-07 |
公开(公告)号: | CN111552576B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | O·F·菲洛蒂;丁承民;E·谢克;S·J·维尔尼尔;R·F·德克;D·M·贾姆罗格 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F9/54 | 分类号: | G06F9/54;G06F16/31;G06F16/332;G06F16/338 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘都;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 问答 系统 插入 摄取 框架 | ||
一种用于问答QA文档数据摄取的系统决定通过第一多个子管道摄取文档数据,该第一多个子管道包括具有第一引擎组的第一子管道和具有第二引擎组的第二子管道,第二引擎组独立于第一引擎组。系统确定文档数据的子集,并决定通过第二多个子管道来摄取该子集,第二多个子管道包括具有第三引擎组的第三子管道和具有第四引擎组的第四子管道,第四引擎组独立于第三引擎组。第二多个子管道的引擎组和第一多个子管道的引擎组是公共类。系统选择来自第二多个子管道的输出数据,而不是来自第一多个子管道的对应的输出数据,并生成知识库。
背景技术
问答(QA)系统通常是计算机应用,其挖掘在知识库中存储的数据以便回答问题。建立知识库涉及通过处理管道来摄取大量输入文档,该处理管道被设计为从文档中提取有用的信息并得出有用的关系。本公开提供了用于QA系统(诸如,但不限于,可从获得的WatsonDiscovery QA系统)中的文档摄取的各种实施例。
发明内容
公开了一种用于QA系统中的文档数据摄取的方法。该方法包括决定通过第一多个子管道来摄取文档数据,该第一多个子管道包括具有第一引擎组的第一子管道和具有第二引擎组的第二子管道。第二引擎组独立于第一引擎组,并且耦接到第一引擎组以从中接收数据。该方法还包括确定文档数据的第一子集。该方法还包括决定通过第二多个子管道摄取第一子集,该第二多个子管道包括具有第三引擎组的第三子管道和具有第四引擎组的第四子管道。第四引擎组独立于第三引擎组,并且耦接到第三引擎组以从中接收数据。第二多个子管道中的引擎组中的至少一个引擎和第一多个子管道中的引擎组中的一个引擎是公共引擎类的成员。该方法还包括:选择来自第二多个子管道的输出数据,而不是来自第一多个子管道的对应的输出数据;以及至少部分地基于所选择的输出数据来生成知识库。
公开了一种用于QA文档数据摄取的系统。该系统包括其中具有指令的存储器以及与该存储器通信的至少一个处理器。该至少一个处理器被配置为执行指令以决定通过第一多个子管道来摄取文档数据,该第一多个子管道包括具有第一引擎组的第一子管道和具有第二引擎组的第二子管道。第二引擎组独立于第一引擎组,并且耦接到第一引擎组以从中接收数据。该至少一个处理器还被配置为执行指令以确定文档数据的第一子集,并决定通过第二多个子管道来摄取第一子集,该第二多个子管道包括具有第三引擎组的第三子管道以及具有第四引擎组的第四子管道。第四引擎组独立于第三引擎组,并且耦接到第三引擎组以从中接收数据。第二多个子管道中的引擎组中的至少一个引擎和第一多个子管道中的引擎组中的至少一个引擎是公共引擎类的成员。该至少一个处理器还被配置为执行指令以选择来自第二多个子管道的输出数据,而不是来自第一多个子管道的对应的输出数据;以及至少部分地基于所选择的输出数据来生成知识库。
公开了一种用于QA系统中的文档数据摄取的计算机程序产品。该计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有体现在其上的程序指令。该程序指令可由至少一个处理器执行以使该至少一个处理器决定通过第一多个子管道来摄取文档数据,该第一多个子管道包括具有第一引擎组的第一子管道和具有第二引擎组的第二子管道。第二引擎组独立于第一引擎组,并且耦接到第一引擎组以从中接收数据。该程序指令还可以由该至少一个处理器执行,以使至少一个处理器确定文档数据的第一子集,并决定通过第二多个子管道来摄取第一子集,该第二多个子管道包括具有第三引擎组的第三子管道和具有第四引擎组的第四子管道。第四引擎组独立于第三引擎组,并且耦接到第三引擎组以从中接收数据。第二多个子管道中的引擎组中的至少一个引擎和第一多个子管道中的引擎组中的至少一个引擎是公共引擎类的成员。该程序指令还可以由至少一个处理器执行,以使该至少一个处理器选择来自第二多个子管道的输出数据,而不是来自第一多个子管道的对应的输出数据;以及至少部分地基于所选择的输出数据来生成知识库。
附图说明
为了更完整地理解本公开,现在结合附图和详细描述来参考以下简要描述,其中相同的附图标记表示相同的部分。
图1是示出根据本公开的实施例的QA系统的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010082280.0/2.html,转载请声明来源钻瓜专利网。