[发明专利]基于受限的语义依存分析的文本推理方法有效

专利信息
申请号: 201110336338.0 申请日: 2011-10-31
公开(公告)号: CN102360346A 公开(公告)日: 2012-02-22
发明(设计)人: 姬东鸿;吕晨;滕冲;张明尧;孙程;陈波;汪辉;史华新;韩欣;吴龙飞 申请(专利权)人: 武汉大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 张火春
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 受限 语义 依存 分析 文本 推理 方法
【说明书】:

 

技术领域

发明属于自然语言处理领域,特别涉及一种基于受限的语义依存分析的文本推理方法。 

背景技术

近几年,文本推理的研究在自然语言处理领域受到了广泛关注,文本推理已从最早的纯粹理论探讨转换为较大规模的理论研究团体和经验性平台建设。2005-2007年,欧共体研究平台PASCAL组织了三届文本推理竞赛RTE(Recognizing Textual Entailment),现由NIST(National Institute of Standards and Technology, 美国国家标准技术研究院)组织接着举办文本推理竞赛,到目前为止,文本推理竞赛RTE系列评测竞赛已经举办6届。计算语言学协会ACL(The Association for Computational Linguistics)还专门组织了几次研讨会,探讨文本推理相关工作及其应用。另外,日本国家科学信息系统中心信息检索系统测试集会议(NACSIS Test Collections for IR ,简称为:NTCIR)也开始了文本推理的组织任务。

从对文本推理研究的现状可以看到,目前文本推理主要关注文本蕴涵,而忽略文本预设和隐含。对于一般的描述性语料,如新闻语料,可能主要涉及文本蕴涵,但在话语性(discourse)或对话性(dialogue)语料中,一般会有大量的文本预设和隐含推理,所以现有仅关注文本蕴涵的文本推理方法并不适用于话语性和对话性语料的推理。下面例1)给出了两个学生A和B间的一段对话。

例1): A-1:你怎么中午又吃一次麦当劳?

B-1:我早上吃过一次。(预设)

A-2:很贵吧?(隐含)

B-2:我有优惠卷。(蕴涵)

1)中,A第一次问B的时候(A-1)利用了一个预设(B-1):B已经吃了一次麦当劳。B在B-1中证实了这个预设。一般来说,连续两次吃麦当劳对于一个学生来说比较贵,这是一种隐含知识,因此A在A-2中基于这种隐含知识,再次询问B。B在回答中,利用了“有优惠券”和“价格不贵”间的蕴涵,回答A,并间接否定了A-2所利用的隐含推理。从此例可看出,对话语的正确理解需要同时处理蕴涵、预设和隐含这三种推理形式。

目前,文本蕴涵推理的策略主要有以下四种:

一、分类策略

该策略下,文本蕴涵形式化为蕴涵和非蕴涵的分类问题。根据已标注的蕴涵和非蕴涵训练实例,学习其中的词汇特征并建立分类器,其中大部分分类器都是基于支持向量机SVM(Support Vector Machine),而用于学习的特征主要是基于同现频率或一阶逻辑的词汇句法和语义特征[1]

二、转换策略

该策略下,语段T和假设H的推理关系取决于T的句法表示是否可以基于蕴涵规则(entailment rules)经过若干转换(transformation)而得到假设H的句法表示,所用算法包括基于树编辑距离、保持语义等价性的转换和概率模型等[2-5]

三、深度语义分析和推理

该策略主要采用传统的逻辑推理、自然逻辑、本体推理或语义特征等[6]

四、性能驱动策略

这种策略主要是针对一些特定的语言形式,如词汇相似性或矛盾(contradiction),设计正确性驱动(precision-oriented)的模块,利用投票机制结合这些模块并辅以针对召回率(recall-oriented)的处理机制,该策略的关键仍是蕴涵规则的自动获取[7]

影响文本推理性能的主要原因如下:

第一,就分类策略而言,文本推理的蕴涵和非蕴涵两个类都比较庞杂,实例间的相似性难以保证,它们的区别性特征就不容易确定,所以据此建立的分类器性能不太理想;就深度语义分析和推理策略而言,推理知识的获取是其主要瓶颈,没有足够的推理知识支撑,推理过程的性能就难以保证。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110336338.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top