[发明专利]用于机器翻译的设备和方法无效
申请号: | 200910007558.1 | 申请日: | 2009-02-23 |
公开(公告)号: | CN101520777A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 釜谷聪史;知野哲朗;降幡建太郎 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 钟胜光 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 机器翻译 设备 方法 | ||
技术领域
本发明涉及一种用于将已输入的源语言语句翻译成目标语言语句的机器翻译设备和机器翻译方法。
背景技术
随着自然语言处理技术的发展,机器翻译设备得到了发展,这种设备接收以源语言表达的源语言语句的输入、将输入语句转换成期望目标语言的语句并输出转换结果。例如,将日文表达的文本等翻译成诸如英文或中文之类的另一种语言的机器翻译设备已经投入实际使用。为了以更高水平的精确度更忠实地翻译源语言的输入语句,这种机器翻译设备需要包括能够针对自然语言的多样性和歧义找到充分的解决方案的机构。
例如,JP-A2000-10974(特开)提出了一种技术,利用该技术,通过与用户交互来补充源语言语句中缺少的格要素(case element)。该技术实现了针对源语言语句翻译期间出现的歧义提供解决方案并实现了高水平的精确度而不会造成分析错误的翻译设备。
然而,有这样一些情形,其中,即使源语言语句没有分析歧义,该翻译设备也不能够产生充分反映源语言语句暗含目的的翻译语句。例如,由于文化背景、措辞或语用的原因,任何源语言都有通常省略的某些单词或短语。情况常常是省略这样的单词或短语不会导致源语言中的文法问题。于是,难以检测到这种情况:在翻译涉及到省略这种单词或短语的源语言语句时,翻译语句未适当反映出源语言语句的暗含目的。
此外,一般而言,机器翻译设备的用户通常对目标语言了解不够。于是,用户极难检查该设备输出的翻译语句以判定翻译语句未恰当反映用户目的并进一步再次输入带补充信息的源语言语句以获得更适当的翻译语句。
发明内容
根据本发明的一个方面,一种机器翻译设备,其包括:范例存储单元,其彼此对应地存储目标语言形式的多个目标语言范例和源语言形式的多个源语言范例,所述多个目标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中对应一个源语言范例的含义;输入接收单元,其接收所述源语言形式的输入语句;搜索单元,其在所述范例存储单元中搜索所述多个目标语言范例中与所述多个源语言范例中匹配于或类似于所述输入语句的一个源语言范例相对应的一个目标语言范例;翻译单元,其通过将所述输入语句翻译成所述目标语言的形式来产生目标语言语句,并通过将所述搜索中找到的所述多个目标语言范例中的所述一个目标语言范例翻译成所述源语言的形式来产生反向翻译语句;检测单元,其检测所述反向翻译语句和所述输入语句之间的多个差异部分;以及输出单元,其输出所述差异部分。
根据本发明的另一个方面,一种机器翻译设备,其包括:范例存储单元,其彼此对应地存储目标语言形式的多个目标语言范例和源语言形式的多个源语言范例,所述多个目标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中对应一个源语言范例的含义;输入接收单元,其接收所述源语言形式的输入语句;搜索单元,其在所述范例存储单元中搜索所述多个目标语言范例中与所述多个源语言范例中匹配于或类似于所述输入语句的一个源语言范例相对应的一个目标语言范例;第一翻译单元,其通过将所述搜索中找到的所述多个目标语言范例中的一个目标语言范例翻译成所述源语言的形式来产生第一反向翻译语句;第二翻译单元,其通过将所述输入语句翻译成所述目标语言的形式来产生目标语言语句,并通过将所产生的目标语言语句翻译成所述源语言的形式来产生第二反向翻译语句;检测单元,其检测所述第一反向翻译语句和所述第二反向翻译语句之间的差异部分;以及输出单元,其输出所述差异部分。
根据本发明的又一方面,一种机器翻译方法,其包括:接收源语言形式的输入语句;在范例存储单元中搜索所述多个目标语言范例中与所述多个源语言范例中匹配于或类似于所述输入语句的一个源语言范例相对应的一个目标语言范例,其中,所述范例存储单元彼此对应地存储目标语言形式的多个目标语言范例和所述源语言形式的多个源语言范例,所述多个目标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中对应一个源语言范例的含义;通过将所述输入语句翻译成所述目标语言的形式来产生目标语言语句;通过将所述搜索中找到的所述多个目标语言范例中的所述一个目标语言范例翻译成所述源语言的形式来产生反向翻译语句;检测所述反向翻译语句和所述输入语句之间的差异部分;以及输出所述差异部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910007558.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于管理数据的方法和设备
- 下一篇:信息处理设备及其控制方法