[发明专利]在开域类型强制中使用本体信息有效

专利信息
申请号: 201180056298.2 申请日: 2011-09-24
公开(公告)号: CN103221915B 公开(公告)日: 2017-02-08
发明(设计)人: D·A·弗鲁茨;A·A·卡利安普;J·W·默多克四世;C·A·韦尔蒂;W·W·扎德罗兹尼 申请(专利权)人: 国际商业机器公司
主分类号: G06F7/00 分类号: G06F7/00;G06F17/00
代理公司: 北京市中咨律师事务所11247 代理人: 于静,张亚非
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 类型 强制 使用 本体 信息
【说明书】:

相关申请的交叉引用

本发明涉及并要求2010年9月24日提交的共同拥有、共同未决的第61/386,019号美国临时专利申请的提交日期的优先权,此临时专利申请的所有公开内容在此全部引入作为参考。

背景技术

有关问答(QA)的当前问题和方法的介绍可以在基于Web的参考http://en.wikipedia.org/wiki/Question_answering中找到。一般而言,QA是一种类型的信息检索。如果给出文档集合(例如万维网或本地集合),则系统应能够检索以自然语言提出的问题的答案。QA被视为比其它类型信息检索(例如文档检索)需要更复杂的自然语言处理(NLP)技术,并且有时被视为超越搜索引擎的后续步骤。

QA研究尝试处理各种问题类型,包括:事实、列表、定义、方式、原因、假设、语义约束和跨语言问题。搜索集合有所不同,从小型本地文档集合到内部组织文档,到编译后的新闻专线报道,再到万维网。

闭域QA在特定领域(例如,医学或汽车维修)下处理问题,并且可以被视为更容易的任务,因为NLP系统可以利用通常以本体形式化的领域特定的知识。开域QA处理有关几乎任何事物的问题,并且只能依赖通用本体和世界知识。另一方面,这些系统通常具有可从其中提取答案的更多数据。

备选地,闭域QA可能指这样一种情况:其中仅接受受限类型的问题,例如询问描述性信息而不是过程信息的问题。

对信息的访问目前由两种范式控制。第一,数据库查询,其回答有关结构化记录集合中的内容的问题。第二,搜索,其响应于针对非结构化数据(例如,文本或html)集合的查询而提供文档链接集合。

这种信息查询范式的一个未解决的主要问题是:没有能够根据包括在文档集合(可以是结构化、非结构化或这两者)中的信息准确回答实际问题的计算机程序。这种实际问题可以是宽泛的(例如“what are the risks of vitamin K deficiency?(维生素K缺乏的危害是什么?)”),或者是狭窄的(例如“when and where was Hillary Clinton’s father born?(希拉里·克林顿的父亲出生在何时何地?)”)。

面临的挑战是理解查询,查找可能包含答案的适当文档,以及提取正确答案以提供给用户。需要更高级的方法以回答开域问题。

发明内容

在一个方面,提供了一种进行问答并使用候选答案评分技术执行自动候选答案评估的计算基础架构和方法,所述候选答案评分技术将候选答案词法类型(LT)映射到查询LAT实例(类型)以产生最终TyCor得分,该得分另外获得和使用一个或多个本体(ontology)以进行类型匹配,并使用公理(axiom)/推理以便考虑类型包含/排除。

因此,在一个方面,提供了一种用于生成问题答案的计算机实现的系统、方法和程序产品,包括:接收输入查询文本字符串;由编程的处理器单元确定与输入查询关联的词法答案类型(LAT)字符串;从数据语料库自动获得所述输入查询的候选答案字符串;将查询LAT字符串映射到结构化资源中的第一类型字符串;将所述候选答案字符串映射到所述结构化资源中的第二类型字符串;判定所述第一类型字符串和所述第二类型字符串是否不相关;以及根据所述类型不相关的判定,对所述候选答案字符串进行评分,其中所述结构化资源包括提供本体内容的语义数据库。

进一步就此方面而言,通过将所述结构化资源中关联所述第一类型字符串与所述第二类型字符串的公理标识为不相关而执行所述判定步骤。

在此进一步方面,类型之间的一个或多个公理包括以下项中的一个或多个:类型之间的等价公理、包容公理以及同级(sibling)公理。

在进一步方面,提供了一种用于生成问题答案的系统,包括:存储器;与所述存储器通信的处理器设备,所述处理器设备执行一种方法,包括:接收输入查询文本字符串;由编程的处理器单元确定与输入查询关联的词法答案类型(LAT)字符串;从数据语料库自动获得所述输入查询的候选答案字符串;将查询LAT字符串映射到结构化资源中的第一类型字符串;将所述候选答案字符串映射到所述结构化资源中的第二类型字符串;判定所述第一类型字符串和所述第二类型字符串是否不相关;以及根据所述类型不相关的判定,对所述候选答案字符串进行评分,其中所述结构化资源包括提供本体内容的语义数据库。

在此进一步方面,通过将所述结构化资源中关联所述第一类型字符串与所述第二类型字符串的公理标识为不相关而执行所述判定步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201180056298.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top