[发明专利]机器翻译系统、机器翻译方法和与其一起使用的解码器有效
申请号: | 201210464448.X | 申请日: | 2012-11-16 |
公开(公告)号: | CN103823795A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 那森;杨振东 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 罗银燕 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 系统 方法 与其 一起 使用 解码器 | ||
1.一种机器翻译方法,包括以下步骤:
接收第一语言的文本;
创建反映所述第一语言的文本中的每个短语组合的短语组合概率的短语组合模型;
通过使用所述短语组合模型、翻译模型和语言模型将所述第一语言的文本翻译为第二语言的文本;
将所述第二语言的文本作为翻译结果输出,其中,所述翻译结果包含被翻译短语。
2.根据权利要求1所述的机器翻译方法,还包括:
将所述第一语言的文本划分为不同范围值的子文本,以及
其中,创建短语组合模型的步骤进一步包括:
对于每个范围值,
枚举所述第一语言的子文本中的可能情况;
对于每个枚举的可能情况产生短语组合;以及
对于每个短语组合计算短语组合概率。
3.根据权利要求2所述的机器翻译方法,其中,对于每个短语组合计算短语组合概率的步骤进一步包括:
判断当前短语组合是否是原始短语组合;
如果当前短语组合是原始短语组合,则通过原始短语组合处理来计算短语组合概率;
否则,通过子短语组合处理来计算短语组合概率。
4.根据权利要求3所述的机器翻译方法,其中,所述原始短语组合处理包括:
执行语法短语组合处理;以及
计算原始短语组合的短语组合概率。
5.根据权利要求4所述的机器翻译方法,其中,所述原始短语组合处理还包括:
执行术语短语组合处理。
6.根据权利要求4所述的机器翻译方法,其中,所述语法短语组合处理包括:
确定当前短语组合是否符合第一语言中的语法结构;
响应于当前短语组合符合语法结构的确定,基于该短语组合中的子短语的原始数量来调整该短语组合中的子短语的折算值。
7.根据权利要求3所述的机器翻译方法,其中,所述子短语组合处理包括:
在分隔点上将当前短语组合划分为左短语组合和右短语组合;
基于以下条件来计算当前短语组合的短语组合概率,
1)是否存在与所述左短语组合对应的可能情况;
2)是否存在与所述右短语组合对应的可能情况;以及
3)所述左短语组合、所述右短语组合和所述当前短语组合是否符合第一语言中的语法结构。
8.根据权利要求2所述的机器翻译方法,其中,翻译的步骤进一步包括:
a)基于所述短语组合模型来计算当前可能情况的所述短语组合概率;
b)基于所述翻译模型来计算当前可能情况的翻译概率;
c)基于所述语言模型来计算当前可能情况的语言概率;
d)组合所述短语组合概率、所述翻译概率和所述语言概率以得到当前可能情况的总累积统计概率;以及
重复步骤a)-d),直到整个文本被翻译以得到翻译结果。
9.根据权利要求1、2或8所述的机器翻译方法,还包括以下步骤:
基于所述翻译结果中的被翻译短语来评估所述翻译结果的翻译质量;
调整所述翻译模型中与被翻译短语对应的翻译候选的翻译概率以用于下一次翻译处理。
10.根据权利要求9所述的机器翻译方法,其中,评估所述翻译结果的翻译质量的步骤进一步包括:
得到所述翻译结果中的每个被翻译短语的总累积统计概率;
根据所述翻译结果中的每个被翻译短语的总累积统计概率来决定质量阈值;
通过总累积统计概率与所述质量阈值的比较来评估每个被翻译短语的翻译质量。
11.根据权利要求10所述的机器翻译方法,其中,评估每个被翻译短语的翻译质量的步骤进一步包括:
在总累积统计概率大于或等于所述质量阈值的情况下,将与被翻译短语对应的翻译候选评估为良好质量;以及
否则,将与被翻译短语对应的翻译候选评估为非良好质量。
12.根据权利要求9所述的机器翻译方法,其中,调整所述翻译模型中与被翻译短语对应的翻译候选的翻译概率的步骤进一步包括:
对于每个被翻译短语,
调整被评估为良好质量的翻译候选的翻译概率;
调整与被评估为良好质量的翻译候选对应的其它翻译候选的翻译概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210464448.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种翻译系统及翻译方法
- 下一篇:一种基于特征注入的仿冒应用程序监测方法