[发明专利]生成译文和机器翻译的方法及装置无效

专利信息
申请号: 200710089195.1 申请日: 2007-03-21
公开(公告)号: CN101271452A 公开(公告)日: 2008-09-24
发明(设计)人: 刘占一;王海峰;吴华 申请(专利权)人: 株式会社东芝
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 北京市中咨律师事务所 代理人: 李峥;刘瑞东
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 生成 译文 机器翻译 方法 装置
【权利要求书】:

1. 一种生成译文的方法,其中,待翻译的第一语种的句子被分割成多个片段,进行了对齐的双语例句库包括多对相对应的第一语种和第二语种的例句以及每对例句之间的对齐信息,并包括与上述第一语种的多个片段的每一个对应的第二语种的至少一个译文片段;上述方法包括:

从与第一语种的句子对应的多个第二语种的译文片段组合中,根据多个特征函数针对译文片段组合的综合得分,选择最优的第二语种的译文片段组合;以及

根据上述最优的译文片段组合,生成第二语种的译文。

2. 根据权利要求1所述的生成译文的方法,其中,上述选择步骤包括根据多个特征函数针对每种译文片段组合的综合得分,选择最优的第二语种的译文片段组合。

3. 根据权利要求1所述的生成译文的方法,其中,上述待翻译的第一语种的句子具有多种分割方式,以及上述选择步骤包括根据多个特征函数针对每种分割方式的译文片段组合的综合得分,选择最优的第二语种的译文片段组合。

4. 根据权利要求3所述的生成译文的方法,其中,上述选择步骤包括根据多个特征函数针对每种分割方式的每种译文片段组合的综合得分,选择最优的第二语种的译文片段组合。

5. 根据权利要求1-4中任何一项所述的生成译文的方法,其中,上述多个特征函数针对译文片段组合的综合得分通过利用线性log模型对每个特征函数针对该译文片段组合的得分进行计算获得。

6. 根据权利要求5所述的生成译文的方法,其中,上述计算上述多个特征函数针对译文片段组合的综合得分的步骤还考虑每个特征函数的权重。

7. 根据权利要求6所述的生成译文的方法,其中,上述计算上述多个特征函数针对译文片段组合的综合得分的步骤利用如下公式进行:

s(e)=Σm=1Mλmhm(e,f,E)]]>

其中,hm代表第m个特征函数,λm代表第m个特征函数的权重,f代表上述待翻译的第一语种的句子,e代表上述第二语种的译文片段组合,E代表生成e所需的译文片段的集合,以及s(e)代表上述多个特征函数针对e的综合得分。

8. 根据权利要求1或3所述的生成译文的方法,其中,上述选择步骤包括:利用搜索算法,选择最优的第二语种的译文片段组合,其中,根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分,作为搜索算法中的代价(cost)。

9. 根据权利要求1所述的生成译文的方法,其中,上述待翻译的第一语种的句子具有多种分割方式,以及上述选择步骤包括利用搜索算法,选择最优的第二语种的译文片段组合,其中,根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分,作为搜索算法中的代价(cost)。

10. 根据权利要求8或9所述的生成译文的方法,其中,上述根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分的步骤包括通过利用线性log模型对每个特征函数针对可能的译文片段或者译文片段的组合的得分进行计算获得。

11. 根据权利要求10所述的生成译文的方法,其中,上述根据多个特征函数针对可能的译文片段或者译文片段的组合计算综合得分的步骤还考虑每个特征函数的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710089195.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top