[发明专利]用于问答系统的插入和摄取框架有效
申请号: | 202010082280.0 | 申请日: | 2020-02-07 |
公开(公告)号: | CN111552576B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | O·F·菲洛蒂;丁承民;E·谢克;S·J·维尔尼尔;R·F·德克;D·M·贾姆罗格 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F9/54 | 分类号: | G06F9/54;G06F16/31;G06F16/332;G06F16/338 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘都;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 问答 系统 插入 摄取 框架 | ||
1.一种用于问答系统(QA)中的文档数据摄取的方法,所述方法包括:
决定通过第一多个子管道来摄取文档数据,所述第一多个子管道包括具有第一引擎组的第一子管道和具有第二引擎组的第二子管道,所述第二引擎组独立于所述第一引擎组并耦接到所述第一引擎组以从中接收数据;
确定所述文档数据的第一子集;
决定通过第二多个子管道摄取所述第一子集,所述第二多个子管道包括具有第三引擎组的第三子管道和具有第四引擎组的第四子管道,所述第四引擎组独立于所述第三引擎组并耦接到所述第三引擎组以从中接收数据,并且所述第二多个子管道中的所述引擎组中的至少一个引擎和所述第一多个子管道中的所述引擎组中的一个引擎是公共引擎类的成员;
选择来自所述第二多个子管道的输出数据,而不是来自所述第一多个子管道的对应的输出数据;以及
至少部分地基于所选择的输出数据来生成知识库;
所述方法进一步包括:
决定通过第三多个子管道来摄取附加文档数据;
其中,生成所述知识库包括:至少部分地基于来自所述第三多个子管道的输出数据来生成所述知识库。
2.根据权利要求1所述的方法,其中,所述第二多个子管道包括从群组中选择的引擎组,所述群组包括所述第一多个子管道中的一个子管道的引擎组的扩展和与所述第一多个子管道中的一个子管道的引擎组相关联的抽象子管道的引擎组的扩展。
3.根据权利要求2所述的方法,其中,所述第一多个子管道还包括具有第五引擎组的第五子管道,所述第五引擎组独立于所述第一引擎组并且独立于所述第二引擎组,并且所述第五引擎组被耦接到所述第一引擎组以从中接收数据。
4.根据权利要求3所述的方法,进一步包括:
通过所述第一多个子管道摄取所述文档数据;以及
与通过所述第一多个子管道摄取所述文档数据并行地通过所述第二多个子管道摄取所述第一子集。
5.根据权利要求3所述的方法,其中,确定所述第一子集包括:至少部分地基于从包括子管道输入数据之间的差异和子管道模型组件之间的差异的群组中选择的差异来确定所述第一子集。
6.根据权利要求3所述的方法,进一步包括:取消选择先前选择的来自所述第二多个子管道的输出数据,其中,所述知识库不基于所述取消选择的输出数据。
7.根据权利要求3所述的方法,其中,所述第三多个子管道包括具有第六引擎组的第六子管道和具有第七引擎组的第七子管道,所述第七引擎组独立于所述第六引擎组并耦接到所述第六引擎组以从中接收数据,并且所述第三多个子管道中的所述引擎组中的至少一个引擎是公共类的成员。
8.一种用于问答(QA)文档数据摄取的系统,所述系统包括:
存储器,在其中具有指令;以及
与所述存储器通信的至少一个处理器,其中,所述至少一个处理器被配置为执行所述指令以执行权利要求1至7的任何方法的任何步骤。
9.一种计算机可读存储介质,其存储程序代码,所述程序代码在由处理器执行时执行权利要求1-7的任何计算机实现的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010082280.0/1.html,转载请声明来源钻瓜专利网。