[发明专利]生成译文和机器翻译的方法及装置无效
申请号: | 200710089195.1 | 申请日: | 2007-03-21 |
公开(公告)号: | CN101271452A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | 刘占一;王海峰;吴华 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 李峥;刘瑞东 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 译文 机器翻译 方法 装置 | ||
1. 一种生成译文的方法,其中,待翻译的第一语种的句子被分割成多个片段,进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息,并包括与上述第一语种的多个片段的每一个对应的第二语种的至少一个译文片段;上述方法包括:
从与第一语种的句子对应的多个第二语种的译文片段组合中,根据多个特征函数针对译文片段组合的综合得分,选择最优的第二语种的译文片段组合;以及
根据上述最优的译文片段组合,生成第二语种的译文。
2. 根据权利要求1所述的生成译文的方法,其中,上述选择步骤包括根据多个特征函数针对每种译文片段组合的综合得分,选择最优的第二语种的译文片段组合。
3. 根据权利要求1所述的生成译文的方法,其中,上述待翻译的第一语种的句子具有多种分割方式,以及上述选择步骤包括根据多个特征函数针对每种分割方式的译文片段组合的综合得分,选择最优的第二语种的译文片段组合。
4. 根据权利要求3所述的生成译文的方法,其中,上述选择步骤包括根据多个特征函数针对每种分割方式的每种译文片段组合的综合得分,选择最优的第二语种的译文片段组合。
5. 根据权利要求1-4中任何一项所述的生成译文的方法,其中,上述多个特征函数针对译文片段组合的综合得分通过利用线性log模型对每个特征函数针对该译文片段组合的得分进行计算获得。
6. 根据权利要求5所述的生成译文的方法,其中,上述计算上述多个特征函数针对译文片段组合的综合得分的步骤还考虑每个特征函数的权重。
7. 根据权利要求6所述的生成译文的方法,其中,上述计算上述多个特征函数针对译文片段组合的综合得分的步骤利用如下公式进行:
其中,hm代表第m个特征函数,λm代表第m个特征函数的权重,f代表上述待翻译的第一语种的句子,e代表上述第二语种的译文片段组合,E代表生成e所需的译文片段的集合,以及s(e)代表上述多个特征函数针对e的综合得分。
8. 根据权利要求1或3所述的生成译文的方法,其中,上述选择步骤包括:利用搜索算法,选择最优的第二语种的译文片段组合,其中,根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分,作为搜索算法中的代价(cost)。
9. 根据权利要求1所述的生成译文的方法,其中,上述待翻译的第一语种的句子具有多种分割方式,以及上述选择步骤包括利用搜索算法,选择最优的第二语种的译文片段组合,其中,根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分,作为搜索算法中的代价(cost)。
10. 根据权利要求8或9所述的生成译文的方法,其中,上述根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分的步骤包括通过利用线性log模型对每个特征函数针对可能的译文片段或者译文片段的组合的得分进行计算获得。
11. 根据权利要求10所述的生成译文的方法,其中,上述根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分的步骤还考虑每个特征函数的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710089195.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于垃圾填埋场的抑菌组合物及其制备方法
- 下一篇:卧式薄膜缠绕包装机