[发明专利]用于机器翻译的装置和方法无效

专利信息
申请号: 200810108309.7 申请日: 2008-06-06
公开(公告)号: CN101320366A 公开(公告)日: 2008-12-10
发明(设计)人: 釜谷聪史;知野哲朗;降幡建太郎 申请(专利权)人: 株式会社东芝
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 永新专利商标代理有限公司 代理人: 钟胜光;王英
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 机器翻译 装置 方法
【说明书】:

技术领域

发明涉及通过组合多种翻译系统将源语言语句翻译成目标语言语句的装置和方法,所述多种翻译系统包括通过参考相似翻译范例进行翻译的翻译系统。

背景技术

作为将以第一语言表达的源语言语句转换成第二语言来输出的相关领域中的机器翻译装置内的翻译系统,已知的有基于规则的翻译系统、基于统计的翻译系统、和基于范例的翻译系统等。

基于规则的翻译系统是一种利用规则来给出翻译方法的翻译系统,其条件例如有形成源语言语句的单词、源语言语句的语法结构和语义解释。基于统计的翻译系统是这样的一种翻译系统,其利用概率统计学习源语言和目标语言的语言行为以及在源语言和目标语言之间翻译期间观察到的语言现象。

基于范例的翻译系统是一种通过模仿充当模型的翻译范例来生成期望的翻译语句的翻译系统,所述充当模型的翻译范例例如是过去的翻译范例以及翻译人员给出的范例翻译。与基于规则的翻译系统和基于统计的翻译系统相比,基于范例的翻译系统能够获得自然而流畅的译文,并具有仅通过增加范例就可以对应于新输入的优点。因此,近年来对基于范例的翻译系统研究得非常多,使用该技术安装的翻译装置已经投入实用。

影响基于范例的翻译系统性能的重要问题之一是安装有该系统的翻译装置参考的范例集合的质量和尺度。搜索最适合于输入语句的相似范例的精度也是影响基于范例的翻译系统性能的重要问题。

考虑到自然语言的多样性,应当包括在范例集合中的译文远非有限数量的。因此,可以说,以较高精度从有限的范例中搜索适当范例语句的技术是范例翻译的关键。

例如,在JP-A2004-62726(特开)中公开了一种提供较高精度范例搜索技术的技术和包括高精度基于范例的翻译系统的翻译装置。通过在搜索范例时搜索目标语言侧的相似度和作为第一语言的源语言侧的相似度而实现这些目标。

例如,假设在范例集合中包括了意思是“我饲养老鼠。”的日语语句J1和对应的英语语句E1“I feed a mouse.”。然后,假设输入英语源语句E2“I feed a seal.”作为翻译目标。这时,在JP-A2004-62726(特开)的方法中,计算源语句E2中的“seal”和英语语句E1中的“mouse”之间的相似度以及作为翻译语句的日语语句中意思为“海豹”的单词和日语语句J1中意思为“老鼠”的对应单词之间的相似度。因为两个单词都表示动物,所以判断它们是相似的,由此系统采纳该范例。换言之,搜索出英语语句E1作为相似范例,并输出意思为“我饲养海豹。”的日语翻译语句作为翻译结果。

根据JP-A2004-62726(特开)的方法,可以通过评估源语言侧和目标语言侧的多义性来改善性能。

然而,一些范例表明,源语言侧和目标语言侧相似度都很强未必会获得精确而自然的翻译语句。例如,基于以上范例,当输入英语源语句E3“Ifeed my son。”时,基于同样的判断采纳相同的范例。结果,输出了不恰当的意思是“我饲养我的儿子。”的日语翻译语句。

在该范例中,因为英语中的单词“feed”具有很多含义,所以在将其翻译成日语时,需要根据上下文从多个翻译单词中选择合适的翻译单词。然而,在JP-A2004-62726(特开)的方法中,因为仅考虑了对应于范例不匹配部分的单词之间的相似度,所以可能会选择不合适的日语翻译作为结果。

例如,假设在范例集合中包括意思为“我正在烤面包。”的日语语句J2以及与对应的英语语句E4“I’m baking bread.”相关联的范例。然后,假设输入意思为“我正在做汤。”的日语源语句J3作为翻译目标。在这种情况下,因为对应于不匹配部分的“面包”和“汤”都是食物,所以采纳以上范例。结果,产生了别扭的译文,如“我正在烤汤。”

即使将认真检查过的范例归入范例集合中,只要是在有限的范例中进行翻译的,这就是一个难以避免的难题。然而,这是一个主要问题,因为用户没有别的选择,只能相信搜索到的范例,而输出的翻译语句则具有缺陷。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810108309.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top