[发明专利]从被回答问题关联语料库/语料值在审
申请号: | 201480040046.4 | 申请日: | 2014-06-26 |
公开(公告)号: | CN105378731A | 公开(公告)日: | 2016-03-02 |
发明(设计)人: | P·F·哈格;D·A·约翰逊;S·J·罗尔达;R·L·史蒂威 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 回答 问题 关联 语料库 语料 | ||
背景技术
本申请一般地涉及改进的数据处理装置和方法,更具体地说,涉及用于从被回答问题关联语料库/语料值的机制。
随着计算网络(例如因特网)使用的增加,人类当前被来自各种结构化和非结构化源的可用于他们的信息量淹没并且不知所措。但是,在搜索有关各种主题的信息期间,随着用户尝试汇聚他们认为相关的能够发现的内容,信息差距大量存在。为了帮助进行此类搜索,最近的研究已涉及生成问答(QA)系统,QA系统可以获得输入问题,分析问题,并且返回指示输入问题的最可能答案的结果。QA系统提供用于在大型内容源集合(例如,电子文档)中搜索的自动机制,并且针对输入问题分析这些内容源以便确定问题答案以及关于答案如何准确用于回答输入问题的置信度量。
一个此类QA系统是可从位于纽约阿蒙克的国际商业机器(IBM)公司获得的WatsonTM系统。WatsonTM系统是高级自然语言处理、信息检索、知识表示和推理以及机器学习技术在开域问答领域中的应用。WatsonTM系统基于IBM的DeepQATM技术构建,该技术用于假设生成、海量证据收集、分析和评分。DeepQATM获得输入问题,分析问题,将问题分解为组成部分,基于分解后的问题和答案源的主要搜索的结果而生成一个或多个假设,基于从证据源的证据检索而执行假设和证据评分,执行一个或多个假设的合成,并且基于训练后的模型,执行最终合并和分级以便连同置信度量一起输出输入问题的答案。
各种美国专利申请公开描述了各种类型的问答系统。第2011/0125734号美国专利申请公开披露一种用于基于数据语料库生成问答对的机制。系统从一组问题开始,并且然后分析该组内容以便提取这些问题的答案。第2011/0066587号美国专利申请公开披露一种用于以下操作的机制:将分析的信息的报告转换为问题集合,并且从信息集合判定是回答还是反驳问题集合的答案。将结果数据纳入更新后的信息模型中。
第2013/0018652号美国专利申请公开披露一种用于以下操作的机制:在问答期间在候选答案之间传播证据以便标识第一候选答案与第二候选答案之间的关系,其中候选答案由问答计算机过程生成,候选答案具有关联的支持证据,并且候选答案具有关联的置信度得分。可以基于所标识的关系,将全部或部分证据从第一候选答案转移到第二候选答案。可以基于转移后的证据,针对第二候选答案计算新的置信度得分。
发明内容
在一个示例性实施例中,提供一种在包括处理器和存储器的数据处理系统中的方法,所述方法用于动态地选择候选答案源子集以便由所述数据处理系统实现的问答(QA)系统使用。所述方法包括由所述数据处理系统实现的所述QA系统接收针对其寻求答案的输入问题,以及由所述QA系统基于所述输入问题生成一个或多个查询。所述方法进一步包括基于分级候选答案源列表,从一组候选答案源中选择候选答案源子集。所述分级候选答案源列表是基于由所述QA系统针对先前输入的问题生成的先前候选答案的特征来生成的。此外,所述方法包括将所述一个或多个查询应用于所述候选答案源子集,以及基于将所述一个或多个查询应用于所述候选答案源子集的结果,针对所述输入问题生成至少一个候选答案。
在其它示例性实施例中,提供一种包括计算机可用或可读介质的计算机程序产品,所述计算机可用或可读介质具有计算机可读程序。所述计算机可读程序当在计算设备上执行时,导致所述计算设备执行上面针对所述方法示例性实施例概述的各种操作和操作组合。
在另一个示例性实施例中,提供一种系统/装置。所述系统/装置可以包括一个或多个处理器和一个存储器,所述存储器耦合到所述一个或多个处理器。所述存储器可以包括指令,当所述指令由所述一个或多个处理器执行时,导致所述一个或多个处理器执行上面针对所述方法示例性实施例概述的各种操作和操作组合。
本发明的这些和其它特性和优点将在以下对本发明的实例实施例的详细说明中进行描述,或者鉴于以下对本发明的实例实施例的详细说明,本发明的这些和其它特性和优点将对所属技术领域的普通技术人员变得显而易见。
附图说明
当结合附图阅读时,通过参考以下对示例性实施例的详细说明,将最佳地理解本发明及其优选使用方式、进一步的目的和优点,这些附图是:
图1示出计算机网络中的问/答(QA)系统的一个示例性实施例的示意图;
图2示出图1的QA系统的一个实施例的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480040046.4/2.html,转载请声明来源钻瓜专利网。