[发明专利]在回答问题系统中实现来自结构化源的非结构化内容利用有效

专利信息
申请号: 202010068135.7 申请日: 2020-01-21
公开(公告)号: CN111488437B 公开(公告)日: 2023-08-11
发明(设计)人: S·A·鲍克斯维尔;K·弗罗斯特;S·J·维尼尔;K·M·布莱克 申请(专利权)人: 国际商业机器公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/31
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 程晨
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 回答 问题 系统 实现 来自 结构 内容 利用
【说明书】:

提供用于在回答问题系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。系统接收问题。将问题提供为标记列表T(T1,T2,…,Tn)。接收包括记录R(R1,R2,…,Rk)的结构化源。将头部H(H1,H2,…,Hi)映射到记录。针对问题中的标记列表T(T1,T2,…,Tn)中的任何标记Ti,对每个记录R1、R2、…、Rk进行搜索。响应于在记录Rj中识别问题中的标记Ti,将标记Ti添加到跟踪结构。将映射到记录Rj的任何头部与问题中的标记列表T(T1,T2,…,Tn)比较。响应于在问题中识别映射到记录Rj的头部Hj,将头部Hj添加到跟踪结构。根据在问题中找出的标记顺序对跟踪结构排序,并将来自跟踪结构的已排序的条目作为问题的回答返回。

技术领域

发明总体上涉及数据处理领域,更具体地涉及用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。

背景技术

在能够回答问题的系统或者问答(Question Answer,QA)系统中,使用诸如数据库记录或电子表格这样的结构化源有时对回答问题是有利的。例如,在问题“古巴的总统是谁?”中,可以通过对表进行查阅并根据像记录中的其他实体或者头部这样的线索解释表的内容来合理地推断正确的回答。在将问题翻译成数据库查询以用于候选回答检索方面已经做了许多工作,但是它们往往需要大量的预备工作或训练数据。在将结构化源翻译成非结构化文本方面也已经做了许多工作,有时称为“表叙述”(table narration)。

需要机制以在能够回答问题的系统中高效地并且有效地实现来自结构化源的非结构化内容利用。

发明内容

本发明的主要方面在于提供用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。本发明的其他重要方面在于提供基本上没有负面效果并且克服现有技术部署的许多缺点的方法、系统和计算机程序产品。

简言之,提供用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的方法、系统和计算机程序产品。由系统接收问题。将问题提供为标记(token)列表T(T1,T2,…,Tn)。接收包括记录R(R1,R2,…,Rk)的结构化源。将头部H(H1,H2,…,Hi)映射到记录。针对问题中的标记列表T(T1,T2,…,Tn)中的任何标记Ti对每个记录R1、R2、…、Rk进行搜索。响应于在记录Rj中识别问题中的标记Ti,将标记Ti添加到跟踪结构(trackingstructure)。将映射到记录Rj的任何头部与问题中的标记列表T(T1,T2,…,Tn)比较。响应于在问题中识别映射到记录Rj的头部Hj,将头部Hj添加到跟踪结构。根据在问题中找出的标记顺序对跟踪结构进行排序,并将来自跟踪结构的已排序的条目作为问题的回答返回。

根据本发明的特征,从由表、电子表格、列表、数组以及数据库记录集合构成的组中选择结构化源。

根据本发明的特征,填充标记列表以模拟与问题比较的段落。

根据本发明的特征,回答得分模型直接对记录R(R1,R2,…,Rk)进行操作。

附图说明

通过在附图中例示说明的本发明的优选实施例的以下详细描述,可以最好地理解本发明以及以上和其他目的及优点,其中:

图1提供根据优选实施例的用于在能够回答问题的系统中实现来自结构化源的非结构化内容利用的示例计算机系统的框图;

图2A、图2B和图3分别是例示说明根据优选实施例的在能够回答问题的系统中实现来自结构化源的非结构化内容利用的示例系统操作的流程图;以及

图4是例示说明根据优选实施例的计算机程序产品的框图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010068135.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top