[发明专利]结合短语结构树的语义角色识别方法有效

专利信息
申请号: 201710877035.7 申请日: 2017-09-25
公开(公告)号: CN107818082B 公开(公告)日: 2020-12-04
发明(设计)人: 周俏丽;杨凤玲 申请(专利权)人: 沈阳航空航天大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G06F40/295
代理公司: 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 代理人: 李晓光
地址: 110136 辽宁省沈*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结合 短语 结构 语义 角色 识别 方法
【说明书】:

发明涉及一种结合短语结构树的语义角色识别方法,包括:句子的剪枝:当系统输入一个句子时,对句子进行短语分析,将分析过后的结果通过插入语或并列结构进行剪枝,简化句子的复杂程度,缩短句子的长度;子句抽取处理:结合短语结构树对剪枝后句子中的子句进行抽取,将抽取出的子句和子句抽取之后剩下的部分分别进行语义角色分析,得到整句的语义角色,将语义角色的分析结果进行还原;边界修正:将还原过后的语义角色结合短语树对句子进行论元边界修正,最终输出句子的语义角色分析结果。本发明简化了句子的复杂程度、缩短了句子的长度,可以使相对比较复杂,且句子的长度较长的句子得到有效的处理,使语义角色的标注情况有所改善。

技术领域

本发明涉及一种自然语言翻译技术,具体为一种结合短语结构树的语义角色识别方法。

背景技术

浅层语义分析是近年来自然语言处理领域研究热点之一,而语义角色标注是目前浅层语义分析所采用的主要形式,语义角色标注(Semantic Role Labeling,简称SRL)主要任务是分析句子的“谓词-论元”结构,给定一个句子,找出句子中谓词的相应语义角色成分,包括核心语义角色(如施事、受事等)和附属语义角色(如地点、时间、方式、原因等)。SRL标注的语义角色对回答5W问题(who、what、when、where、why)提供了强有力的支持。例如,“He bought a bunch of roses yesterday at the Florist”,对谓词“bought”进行语义角色分析,其中“He”是动作的发出者,即施事A0,“a bunch of roses”是动作的承受者,即受事A1,“yesterday”是动作的发生时间,即AM-TMP,“at the Florist”是动作发生的地点,即AM-LOC。SRL综合利用了底层的分词、词性标注、句法分析、命名实体识别等信息。作为自然语言理解的底层研究在信息抽取、问答系统、指代消解、机器翻译等方面有着广泛的应用。

在语义角色标注中,最早进行研究的Gildea和Jurafsky等人提出利用机器学习的方法对语义角色进行自动标注,使用了语义角色标注系统最常使用的七个特征,其中在识别谓词和论元之间关系时用到了句法树的特征。在此基础之上,Gildea和Palmer等人进一步在PropBank语料库上做了同样的实验,基于手工标注的短语句法树,使F值有了进一步的提升。随后,有很多人尝试使用不同的标注单元、特征、分类器、机器学习等方法加以改进。Xue和Palmer等人提出在单一短语结构句法树的基础上,验证了Gildea的七个基本特征在SRL各个阶段的贡献,提出了新的特征,并基于手工标注的短语结构句法树,使F值又进一步提升。刘挺和车万翔等人选取了较多的特征,使用最大熵分类器将识别和分类进一步做训练,然后做相关的后处理,在单一自动短语结构句法分析上取得了比较好的结果,但并未详细给出性能提升的具体原因。Moschitti等人引入不同类型的树核捕捉句法树的结构相似度,该方法在自动学习到特征很有吸引力,但是同时也会带来高计算成本的开销。Boxwell等人提出了一种基于丰富特征的SRL方法,其中结合了组合范畴、短语结构和依存3种句法分析的特征,但多种句法分析在带来了丰富信息的同时,也带来了较大的噪声。李世奇等人提出基于短语结构句法分析的语义角色标注,即以句法为语义角色标注的单元,分为两个子任务:一是语义角色识别,目标是从句子中抽取所有可以充当语义角色的句法成分;二是语义角色分类,判断语义角色识别阶段所得的语义角色的类型,但对于比较复杂的句子处理并未得到好的处理效果。以上的分析方法结合短语结构树进行语义角色标注时并未对句子进行简化,仅仅将短语结构树作为一种特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳航空航天大学,未经沈阳航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710877035.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top