[发明专利]机器翻译系统、机器翻译方法和与其一起使用的解码器有效
申请号: | 201210464448.X | 申请日: | 2012-11-16 |
公开(公告)号: | CN103823795A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 那森;杨振东 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 罗银燕 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 系统 方法 与其 一起 使用 解码器 | ||
技术领域
本发明大体上涉及自然语言处理,并且更特别地,涉及机器翻译系统、机器翻译方法和与其一起使用的解码器。
背景技术
统计机器翻译是对于大词汇量文本翻译的有前途的方法。已提出了许多统计机器翻译系统,诸如美国专利7340388、美国专利5477451或美国专利7295962中的那些统计机器翻译系统。这些系统的基本原理是:使用翻译模型来捕捉源语言与目标语言之间的对应关系,使用翻译模型和语言模型来驱动解码器得到翻译结果。然而,这些系统没有考虑短语组合问题。
还提出了如以下文献中的一些基于语法的机器翻译系统:[Yamada 2001]Kenji Yamada和Kevin Knight,“A syntax-basedstatistical translation model(基于语法的统计翻译模型)”,Proceedingsof the ACL,2001;[Yamada 2002]K.Yamada和K.Knight,“ADecoder for Syntax-Based Statistical MT(用于基于语法的统计MT的解码器)”,Proc.of the Conference of the Association forComputational Linguistics(ACL),2002;或者[Graehl 2004]JonathanGraehl和Kevin Knight,“Training Tree Transducers(训练树变换器)”,Proceedings of the 2004 Meeting of the North American chapterof the Association for Computational Linguistics(NAACL-04),2004。这些系统在源语言或目标语言侧进行解析,并基于解析树来翻译句子。但是,这些系统仅根据遵守语法解析的节点单元来运行翻译处理,并且它们并不研究不是语法结构的短语组合问题。而且,这些系统没有展现用于短语组合概率的特殊模型。
美国专利6996518公开了用于自动衡量机器翻译质量的方法。该方法使用从源语言翻译到目标语言再翻译到源语言的“来回”翻译处理,以识别整个翻译结果的质量。如果所得的源语言文本中的“来回”翻译结果并不合理地等同于原始的源语言文本,则该翻译被识别为低质量。该“来回”翻译重复多次(其中每次重复具有解码处理),直到所得的源语言文本合理地等同于原始的源语言文本、或者直到所述处理重复预定次数,这导致大量的计算量并且是耗时的。该方法也没有考虑短语组合问题。
发明内容
可以看出,没有一种现有技术系统考虑了短语组合问题,短语组合没有被明确地建模,不同的短语组合被假定为相同的短语组合概率或者根本就不被考虑。这是不合理的,因为不同的短语组合具有不同的短语组合概率。
而且,一旦现有技术系统的翻译模型被训练,该翻译模型就保持静止。这些系统中的许多系统是开环的,如何评估输出中的短语翻译的质量以及如何使用该评估来指导下一次翻译处理仍然是个问题。
鉴于以上问题,需要一种新颖的用于将文本从第一语言(即,源语言)翻译到第二语言(即,目标语言)的系统和方法。
根据本发明的一方面,一种机器翻译方法包括以下步骤:
接收第一语言的文本;
创建反映第一语言的文本中的每个短语组合的短语组合概率的短语组合模型;
通过使用短语组合模型、翻译模型和语言模型将第一语言的文本翻译为第二语言的文本;
将第二语言的文本作为翻译结果输出,其中,所述翻译结果包含被翻译短语。
另外,本发明的机器翻译方法还包括以下步骤:基于翻译结果中的被翻译短语来评估翻译结果的翻译质量;调整翻译模型中与被翻译短语对应的翻译候选的翻译概率以用于下一次翻译处理。
根据本发明的另一方面,一种机器翻译系统包括:
输入单元,被配置为接收第一语言的文本;
创建单元,被配置为创建反映第一语言的文本中的每个短语组合的短语组合概率的短语组合模型;
翻译单元,被配置为通过使用短语组合模型、翻译模型和语言模型将第一语言的文本翻译为第二语言的文本;
输出单元,被配置为将第二语言的文本作为翻译结果输出,其中,所述翻译结果包含被翻译短语。
另外,本发明的机器翻译系统还包括:评估单元,被配置为基于翻译结果中的被翻译短语来评估翻译结果的翻译质量;调整单元,被配置为调整翻译模型中与被翻译短语对应的翻译候选的翻译概率以用于下一次翻译处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210464448.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种翻译系统及翻译方法
- 下一篇:一种基于特征注入的仿冒应用程序监测方法