[发明专利]一种计算机辅助翻译方法及装置有效
申请号: | 202010519190.3 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111652006B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 刘鹏;周玉;邓彪 | 申请(专利权)人: | 北京中科凡语科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 席小东 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算机辅助 翻译 方法 装置 | ||
本发明提供一种计算机辅助翻译方法及装置,装置包括接收模块;术语匹配模块,用于根据术语表,匹配待翻译文本中的所有术语;替换模块,用于将术语匹配模块匹配到的每一个术语,替换为特殊标记;译文的原文匹配度计算模块,用于计算术语的每一种译文的原文匹配度;翻译引擎,用于对术语替换后的待翻译文本,使用机器翻译技术将其翻译为目标语种,得到候选译文;译文匹配度计算模块,用于根据候选译文中的术语位置,计算术语每种翻译的译文匹配度;筛选模块、回填模块和输出模块。具有以下优点:本发明用于计算机辅助翻译系统中的术语匹配,当术语存在一对多翻译时,能够准确解决术语的翻译问题,提升翻译质量。
技术领域
本发明属于翻译技术领域,具体涉及一种计算机辅助翻译方法及装置。
背景技术
机器翻译是自然语言处理的翻译范围,主要研究如何将一种语言自动翻译为另外一种语言,解决人们之间的语言障碍问题。经过几十年的发展,机器翻译性能逐步提升,翻译效果显著提高。
文件翻译是机器翻译的重要应用场景,用于将一种语言的输入文件,自动翻译为另一种语言。
然而,现有的文件翻译方法,主要具有以下问题:
在翻译过程中,术语是非常重要的资源,在不同领域中,术语会有不同的含义。例如,“AI”可以翻译成人工智能,但是在医疗领域,应该被翻译成“芳香化酶抑制剂”,可见,在不同应用场景下,术语的译文具有很大的差别。
现有技术只适用于具有单一翻译的术语。当术语具有多种翻译时,常常无法准确对术语进行翻译,从而造成翻译结果的不准确。
发明内容
针对现有技术存在的缺陷,本发明提供一种计算机辅助翻译方法及装置,可有效解决上述问题。
本发明采用的技术方案如下:
本发明提供一种计算机辅助翻译方法,包括以下步骤:
步骤1,接收待翻译文本;
步骤2,根据术语表,匹配待翻译文本中的所有术语,从而在待翻译文本中,定位到每一个术语;
步骤3,将步骤2定位到的每一个术语,替换为特殊标记;其中,对于同一种术语,替换为相同的特殊标记;对于不同种的术语,替换为不相同的特殊标记;
步骤4,对于每一种术语,采用以下方法计算术语的每一种译文的原文匹配度:
步骤4.1,设原文语种的术语为e0,具有n种目标语种的译文,分别为c1、c2、c3…cn;
步骤4.2,在原文语种的待翻译文本中,取术语e0的上下文信息,假设取术语e0的前面相邻的m个原文语种的词,分别为:e-m,…,e-2,e-1;取术语e0的后面相邻的u个原文语种的词,分别为:e1,e2,…,eu;
将术语e0的上下文信息和术语e0组成原文关键信息e-m,…,e-2,e-1,e0,e1,e2,…,eu;将原文关键信息分别和每一种目标语种的译文组成形成一种原文关键组合信息,然后以原文关键组合信息为查询条件,在搜索引擎中查找原文关键组合信息的出现次数,即:分别查找以下原文关键组合信息的出现次数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科凡语科技有限公司,未经北京中科凡语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010519190.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型靠椅
- 下一篇:一种辅助脉冲震荡用固定装置