[发明专利]基于多词单元进行辅助翻译的方法和装置在审
申请号: | 201410164469.9 | 申请日: | 2014-04-22 |
公开(公告)号: | CN105095191A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 付亦雯;郑仲光;方瑞玉;孟遥;孙俊;宋昕 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单元 进行 辅助 翻译 方法 装置 | ||
技术领域
本发明涉及计算机辅助翻译领域,特别涉及一种基于多词单元进行辅助翻译的方法和装置。
背景技术
计算机辅助翻译,是通过人工智能搜寻及比对技术,运用参考数据库和翻译存储程序,记录翻译人员所完成的译文,当遇到相同与重复的句型、词组或专业术语时,能向翻译人员提供建议和解决方案,有效节省翻译时间及成本,同时确保翻译品质。
计算机辅助翻译充分运用数据库功能,将已翻译的文本内容加以储存。当日后遇到相似或相同的翻译文句时,计算机会自动比对并建议翻译人员使用数据库中已有的译文作为可能的翻译,让翻译人员自行决定是否接受、编辑或拒绝使用。计算机辅助翻译在概念上与一般机器翻译、翻译机、翻译软件及线上翻译软件是截然不同的。计算机辅助翻译并非仅仅将文句词语交给软件处理后,将软件处理结果即作为最终的翻译结果。在计算机辅助翻译中,计算机处理的结果仅供翻译人员参考,并非最后的翻译结果,而是最终由翻译人员来决定最适合的翻译结果。
在计算机辅助翻译的帮助下,译员的翻译效率得到提升,但是计算机辅助翻译并不能解决所有问题。对于没有历史记录的语句依旧需要用户进行完整输入,并且译员的日常翻译工作中包含许多不常用的短语,输入这些短语的译文通常需要多次的击键操作,这会使翻译效率下降。另外,即使是专业的翻译人员也会遇到不会翻译的词语,尤其是专业术语,因此查询译文的操作也同样会耽误很多时间。此时,可能会使用到SMT(StatisticalMachineTranslation,统计机器翻译)进行翻译。尽管SMT在专业术语翻译方面拥有较高的准确率,但是它并不能独立地完成一个翻译任务,并且译员使用SMT进行翻译同样会耽误较多时间,导致翻译效率下降。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于现有技术的上述缺陷,本发明的目的之一是提供一种基于多词单元进行辅助翻译的方法和装置。
为了实现上述目的,根据本发明的一个方面,提供了一种基于多词单元进行辅助翻译的方法。该方法包括:获取用户输入的源语言音节或目标语言音节;获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;根据所述多词单元的权值显示目标语言的所述多词单元。
根据本发明的另一个方面,提供了一种基于多词单元进行辅助翻译的装置,包括:用户输入获取部件,配置为获取用户输入的源语言音节或目标语言音节;多词单元获取部件,配置为获取与用户输入的所述音节相关联的、且取自待翻译源语言文本中的至少一个多词单元;短语提取部件,配置为将所述多词单元划分为多个短语,并从划分后的所述多词单元中提取出多个短语组合;权值计算部件,配置为利用预先建立的模型,至少根据所述多词单元的各短语组合在所述待翻译源语言文本中出现的频率,计算所述多词单元的权值;以及输出显示部件,配置为根据所述多词单元的权值显示目标语言的所述多词单元。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述方法。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中:
图1示出根据本发明的一个具体实施例的基于多词单元进行辅助翻译的方法的示例流程图;
图2示出在权值计算步骤中计算多词单元的多个短语组合之间的共现度值的方法的示例流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410164469.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种访问数据实体的方法及装置
- 下一篇:一种作者分析方法和作者分析系统