[发明专利]机器翻译设备和方法无效
申请号: | 200910126931.5 | 申请日: | 2009-03-05 |
公开(公告)号: | CN101526937A | 公开(公告)日: | 2009-09-09 |
发明(设计)人: | 釜谷聪史;知野哲朗;住田一男 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 钟胜光 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 设备 方法 | ||
技术领域
本发明涉及一种用于将以源语言输入的语句机器翻译成目标语言语句的设备和方法。
背景技术
随着自然语言处理技术向前进展,转换以第一语言(源语言)输入的语句并输出第二语言(目标语言)语句的机器翻译设备已经得到了发展。在这些设备中,用于将日文文本翻译成诸如英文和中文之类的其他语言的机器翻译系统已经投入实用。尽管已经为这种翻译装置提出过很多翻译系统,但仍未实现能够为每句话产生恰当翻译的系统。
在机器翻译中,采用了自然语言处理技术,其包括语形学分析和句法(syntactic)分析(相关性分析)。作为实现高精度翻译机器的一种方式,提高这些技术中每种的处理精度很重要。例如,JP-A2006-53679(特开)提出了一种能够以高精度提供翻译处理的自然语言分析装置。根据这项技术,并不是逐个评估剖析林(parse tree)所包含的剖析树,而是对其整体进行相关性分析,从而能够从多个选项中选择最可信的翻译,而不会落入局部最优的情况。
此外,作为实现高精度翻译的方法,曾提出过通过组合不同翻译系统来翻译源语言语句的翻译装置。例如,JP-A2001-222529(特开)提出了一种翻译技术,利用这种技术,基于输入语句的外在模式将以源语言输入的语句划分成子串,切换翻译系统使其通过为每个子串选择最适当的翻译系统而工作,集成翻译结果以获得全句的翻译。
然而,根据JP-A 2001-222529(特开),是利用其外在模式,例如短语和从句作为单元,以一维方式划分输入语句的。因此,有可能限制划分模式的类型并以不适于翻译的单元来划分语句。这可能会妨碍翻译质量的提高。
发明内容
根据本发明的一个方面,一种机器翻译设备,其包括:输入单元,其输入源语言形式的源语言语句;语素分析单元,其对所述源语言语句进行语形学分析并输出所述源语言语句的语素序列;句法分析单元,其对所述源语言语句的语素进行句法分析并输出所述源语言语句的句法结构;第一提取单元,在所述句法结构中包括的第一节点充当有效节点时,所述第一提取单元从所述句法结构提取与第一部分结构相对应的第一子串,所述第一部分结构包括要统一到所述第一节点的每一个中的所有叶子方向的节点;第二提取单元,在与所述第一节点具有直接或间接语法关系的第二节点充当所述有效节点时,所述第二提取单元从所述句法结构提取与第二部分结构相对应的第二子串,所述第二部分结构代表包括要统一到所述第二节点的每一个中的所有叶子方向节点的部分结构和所述第一部分结构之间的差异;翻译单元,其利用多个翻译系统中的每一个将所述第一子串和所述第二子串翻译成目标语言的形式,并产生部分翻译信息,在所述部分翻译信息中,代表翻译可靠性的翻译分数与翻译结果相关联;选择单元,其从所述部分翻译信息的条目的多个组合中选择一个组合,其中要选择的组合满足如下条件:作为所述部分翻译信息的条目中包括的翻译结果的原文的所述第一子串和所述第二子串彼此不交叠,所述源语言语句中包括的语素中的每一个匹配作为所述组合内所述部分翻译信息中包括的翻译结果的原文的所述第一子串和所述第二子串之一,且基于所述部分翻译信息中包括的所述翻译分数计算的用于表示所述组合可靠性的第一可信度采取最大值;产生单元,其通过翻译所述源语言语句产生所述目标语言形式的目标语言语句,使得所述目标语言语句具有所选组合内的所述部分翻译信息中包括的翻译结果;以及输出单元,其输出所述目标语言语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910126931.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:驱动液晶显示器设备的装置和方法
- 下一篇:图像形成装置