[发明专利]翻译方法及装置无效
申请号: | 201010548671.3 | 申请日: | 2010-11-18 |
公开(公告)号: | CN102467498A | 公开(公告)日: | 2012-05-23 |
发明(设计)人: | 孙健;唐晶明;马永亮;初敏;郭稷;胡覃;刘涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 方法 装置 | ||
技术领域
本申请涉及计算机翻译技术领域,特别涉及一种翻译方法及装置。
背景技术
随着计算机的快速发展,利用计算机来实现不同语言之间的翻译技术早已为人所熟知,也称为自动翻译,自动翻译是一种不需要人为参与的翻译方式,用户在自动翻译界面中输入一段源语言文本后,选择源语言种类和目标语言种类,翻译装置自动将输入的源语言文本翻译为目标语言文本,并将翻译后的目标语言文本提供给用户,其中翻译装置通常采用下述三种翻译模式:
第一种翻译模式,基于翻译规则的翻译模式:预先设置由源语言到目标语言的翻译规则和翻译词典,将用户输入的源语言文本划分为多个待翻译的源语言语句,针对每个待翻译的源语言语句进行分析,确定出将该待翻译的源语言语句由源语言翻译为目标语言的翻译规则,然后基于确定出的翻译规则,根据预先设置的翻译词典,将该待翻译的源语言语句由源语言翻译为目标语言,得到目标语言语句,将翻译后的各个目标语言语句组合为翻译后的目标语言文本。
第二种翻译模式,基于翻译实例的翻译模式:预先获得大量的针对片段的翻译实例,将用户输入的源语言文本划分为多个待翻译源语言语句,再将每个待翻译的源语言语句划分为多个待翻译的源语言片段,每个待翻译的源语言片段包含至少一个短语,查找各个待翻译的源语言片段的翻译实例,根据查找到的翻译实例,将每个待翻译的源语言片段由源语言翻译为目标语言,得到各个目标语言片段,然后由各个目标语言片段组合为翻译后的目标语言语句,再由各个目标语言语句组合为翻译后的目标语言文本。
第三种翻译模式,基于模型的翻译模式:预先设置翻译模型和语言模型,翻译模型描述了由源语言片段翻译为目标语言片段的概率值,即翻译模型概率值,语言模型描述了目标语言语句符合语法和使用习惯的概率值,即语言模型概率值。将用户输入的源语言文本划分为多个待翻译的源语言语句,再将每个待翻译的源语言语句划分为多个待翻译的源语言片段,确定每个待翻译的源语言片段翻译为目标语言后的各个目标语言片段以及各个目标语言片段对应的翻译模型概率值,针对划分的每个待翻译的源语言语句,由各个待翻译的源语言片段的目标语言片段可以组合出多个目标语言语句,针对组合后的每个目标语言语句,翻译装置确定该目标语言语句的语言模型概率值,然后将该目标语言语句中的每个目标语言片段的翻译模型概率值相乘,得到该目标语言语句的翻译模型概率值,将该目标语言语句的语言模型概率值和翻译模型概率值相乘,得到该目标语言语句的综合权重值,将综合权重值最大的目标语言语句确定为该待翻译的源语言语句翻译后的目标语言语句。
自动翻译结束后,用户可能对自动翻译结果不满意,用户可以对自动翻译结果进行修改。例如,自动翻译结果中的某个语句存在语法问题,用户可以对该语句进行修改。为了便于用户检查自动翻译结果,也可以在例句库存储的翻译例句资源中,查找每个待翻译的源语言语句的翻译结果,例句库存储的翻译例句资源包含了各个源语言语句和目标语言语句的对应关系,以及在存储的用户词典中,查找每个待翻译的源语言单词的翻译结果,将查找到的翻译结果提供给用户。若用户对自动翻译结果中的某个语句进行了修改,则可以根据修改后的语句对例句库存储的翻译例句资源进行更新。
现有技术中,若用户对自动翻译结果中的某个语句进行了修改,则可以认为该语句在由源语言翻译为目标语言的自动翻译过程中存在翻译错误的问题。但是翻译装置后续对该语句进行由源语言到目标语言的翻译过程中,还是会按照原有的方法进行翻译,因此还是会产生相同的翻译错误问题,这导致自动翻译的翻译的正确性较低。
发明内容
本申请实施例提供一种翻译方法及装置,用以解决现有技术中存在的自动翻译的翻译正确性较低的问题。
本申请实施例技术方案如下:
一种翻译方法,该方法包括步骤:获得对自动翻译结果进行修改得到的修改结果;根据获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新;获得需进行自动翻译的源语言文本;根据更新后的自动翻译资源,将获得的源语言文本翻译为目标语言文本。
一种翻译装置,包括:修改结果获得单元,用于获得对自动翻译结果进行修改得到的修改结果;自动翻译资源更新单元,用于根据修改结果获得单元获得的修改结果,对进行自动翻译所需的自动翻译资源进行更新;源语言文本获得单元,用于获得需进行自动翻译的源语言文本;翻译单元,用于根据自动翻译资源更新单元更新后的自动翻译资源,将源语言文本获得单元获得的源语言文本翻译为目标语言文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010548671.3/2.html,转载请声明来源钻瓜专利网。