[发明专利]计算机辅助翻译的方法及系统无效
申请号: | 201110139182.7 | 申请日: | 2011-05-26 |
公开(公告)号: | CN102193914A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 刘群;王洋;刘洋;骆卫华;吕雅娟 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机辅助 翻译 方法 系统 | ||
技术领域
本发明属于计算机辅助翻译领域,尤其涉及一种给机器翻译结果提供辅助翻译修改功能的方法。
背景技术
随着科学技术和互联网的快速发展,计算机和网络技术已经深入我们工作、生活的方方面面。在翻译领域,最令人激动的莫过于计算机辅助翻译技术CAT(Computer Aided Translation)。在计算机辅助翻译系统的设计中存在着两种不同思路:一种是机器翻译(Machine Translation),另一种是翻译记忆(Translation Memory)。
近些年机器翻译技术取得了巨大的进步,但是由于自然语言的复杂性,机器翻译的译文难以做到完满的程度。同时传统机器翻译的结果只提供给用户一个最佳译文,并没有提供帮助用户修改翻译结果的辅助信息,这使得对于外语水平较低的用户很难对译文做出修改,阻碍了机器翻译的普及应用。
而采用翻译记忆所设计的计算机辅助翻译系统在辅助信息推荐方面功能强大,但是其所面临的困境主要是该软件主要靠用户翻译历史的积累自动构建翻译记忆库,从而给出相似短语的提示信息。在没有大量翻译记忆的前提下,该软件就很难给用户提供有用的帮助信息,特别的是该软件对用户的英语水平要求过高,使得只有专业的翻译人员才适合使用。
利用机器翻译过程中的中间信息和其他辅助信息来对自动翻译的结果进行高效的修改和完善,提高翻译的质量和效率,已成为相关研究者的关注焦点。已有的方法基本上可以分为两类:一类是在给出机器自动翻译结果的基础之上,再给出若干短语的候选翻译,供用户选择;另一类是给出机器自动翻译结果仅供参考,同时给出源语言句子的相关候选短语,由用户点击构成目标语言句子。
例如,参考文献1(Philipp Koehn,Interactive assistance to human translators using statistical machine translation methods,Machine Translation Summit XII,2009)提出的Caitra系统,其采用机器自动翻译和人工翻译结合的方法,翻译系统使用的是摩西解码器(Moses),采用web的方式由用户来对翻译结果进行修改,并且用户每一次对翻译结果做出修改后,该系统都会重新给出候选短语。
但是,Caitra系统所提供给用户的候选短语表仅来源于统计机器翻译中的短语表,并没有引入更加丰富的候选短语来源,而且其所给出的用户可编辑的区域仅仅是一个文本框,用户对候选短语表的选取操作只是在文本框的末尾追加上新选取的单词。
另外,Google在线翻译在2010年开始也提供了辅助翻译功能,当用户提交翻译源文后,该系统在给出最佳翻译结果的基础上,对翻译结果的呈现也选择了短语的形式,并且提供了目标短语的若干个候选,用户可以用鼠标点击选择修改翻译结果,这些候选翻译的信息方便了用户对翻译结果进行简单地修改,但是对于短语语序的调整还不太方便,并且如果用户对当前的短语划分不满意的话,系统也没有给出其他划分方法的提示。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种计算机辅助翻译的方法及系统,利用更丰富的辅助翻译信息(例如,机器翻译解码过程的中间结果、记忆库、词典等)来修改和完善机器自动翻译的结果,并为用户编辑和修改翻译结果提供更灵活的交互方式。
本发明的目的是通过以下技术方案实现的:
一方面,本发明提供了一种计算机辅助翻译的方法,包括:
步骤1,通过机器翻译对源语言文档,进行自动翻译并生成中间结果数据;
步骤2,利用机器翻译解码过程的中间结果,以及记忆库、词典等信息生成辅助翻译信息;
步骤3,用户借助辅助翻译信息,通过辅助翻译调整方法对自动翻译的结果进行修改,生成最终目标语言文档。
根据本发明实施例的计算机辅助翻译的方法,所述步骤1中包括以下步骤:
生成一个最佳候选译文,用于翻译结果的呈现;
生成多个候选短语并为每个候选短语生成多个候选译文;所述候选短语的候选译文具有概率并按照从大到小排序。
根据本发明实施例的计算机辅助翻译的方法,所述步骤2中包括以下步骤:
针对不同用户推荐和用户最为相关的候选信息;
根据用户的历史行为,动态调整候选信息的推荐内容。
根据本发明实施例的计算机辅助翻译的方法,所述步骤3中包括以下步骤:
自动翻译的结果以短语为单位分块显示;
所述辅助翻译调整方法包括以下操作:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110139182.7/2.html,转载请声明来源钻瓜专利网。