[发明专利]基于并行处理的翻译方法和设备在审
申请号: | 201710347966.6 | 申请日: | 2017-05-17 |
公开(公告)号: | CN107729324A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 李昊潼;朴永起;罗辉栋;文珉暎;宋仁哲 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京铭硕知识产权代理有限公司11286 | 代理人: | 闫红玉,张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 并行 处理 翻译 方法 设备 | ||
本申请要求于2016年8月10日提交到韩国知识产权局的第10-2016-0101726号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
以下描述涉及一种基于并行处理的翻译方法和设备。
背景技术
互联网和信息通信(IT)技术的发展使得提供各种语言的内容成为可能。尤其,经济全球化已加速用于使用各种语言的用户之间的交流和以各种语言提供的内容翻译的翻译技术的发展。
使用现有的翻译硬件和技术,用户之间的语言差异可能会引起不便,因为:翻译可能需要更大量的时间,而且每次翻译可能需要更多数量的阶段来在提供用于不同语言的用户之间的交流的翻译结果的方面传递更加准确的表达和含义。
发明内容
提供本发明内容以用简化的形式介绍对在下面的具体实施方式中进一步描述的构思的选择。本发明内容不是旨在确定所要求保护主题的关键特征或必要特征,本发明内容也不是意图被用于帮助确定所要求保护主题范围。
在一个总体方面,一种翻译方法包括:使用一个或多个处理器,针对第一语言的源句子并行执行多个不同的翻译处理,所述多个不同的翻译处理包括:在所述多个不同的翻译处理中的两个或更多个翻译处理中的每个翻译处理中对源句子进行编码,或者在所述多个不同的翻译处理的各个翻译处理中对源句子和源句子的变型进行编码,以产生各自的特征向量;对各自的特征向量中的每个特征向量进行解码,以产生第二语言的各自的多个候选句子;从第二语言的所述各自的多个候选句子选择第二语言的最终句子。
可通过不同的图形处理器(GPU)来实现所述多个不同的翻译处理,每个GPU包括翻译编码器和翻译解码器,可将源句子输入到至少两个GPU或者可将源句子输入到至少一个GPU并可将源句子的变型输入到另外的至少一个GPU,以执行所述多个不同的翻译处理。
可通过翻译系统的一个或多个处理器来实现所述多个不同的翻译处理,其中,所述一个或多个处理器均包括翻译系统的多个编码器中的一个或多个翻译编码器和翻译系统的多个解码器中的一个或多个翻译解码器,所述翻译方法还可包括:将源句子并行输入到所述多个编码器中的至少两个编码器。
所述方法还可包括:将源句子的变型输入到所述多个编码器中的至少一个编码器;改变所述多个编码器中的至少一个编码器,和/或改变所述多个解码器中的至少一个解码器,以执行所述多个不同的翻译处理。
所述方法还可包括通过基于与第一语言关联的信息改变源句子的词序和/或基于与第一语言关联的信息使用同义词替换包括在源句子中的词,来产生源句子的变型,并可包括将源句子的变型输入到所述多个编码器中的所述至少一个编码器。
改变所述多个编码器中的所述至少一个编码器的步骤包括:通过将噪声分别应用于将被分别应用到所述至少一个编码器的相应参数值或相应激活函数,来改变所述至少一个编码器;其中,改变所述多个解码器中的所述至少一个解码器的步骤包括:通过将噪声分别应用于将被分别应用到所述至少一个解码器的相应参数值或相应激活函数,来改变所述至少一个解码器。
所述方法还可包括:变化或改变所述一个或多个处理器中的至少一个处理器中的编码器,和/或变化或改变所述一个或多个处理器中的至少一个处理器中的解码器,以执行所述多个不同的翻译处理。
所述方法还可包括以下步骤中的至少一个:通过使用已经通过与曾用于训练所述编码器的初始训练值、训练集或训练序列不同的初始训练值、训练集和训练序列中的至少一个训练的另一编码器替换所述编码器,来执行变化或改变所述编码器的操作;通过使用已经通过与曾用于训练所述解码器的初始训练值、训练集或训练序列不同的初始训练值、训练集和训练序列中的至少一个训练的另一解码器替换所述解码器,来执行变化或改变所述解码器的操作。
产生所述多个各自的候选句子的步骤可包括:在每个翻译处理中使用各自的束搜索算法产生预设数量的候选句子。
所述各自的束搜索算法可以是具有比n-最优束搜索算法低的复杂度的m-最优束搜索算法,其中,n大于m。
选择第二语言的最终句子的步骤可包括:计算第二语言的多个候选句子的各自的分数;并选择在第二语言的所述多个候选句子中具有最高分数的所述多个候选句子中的一个候选句子作为第二语言的最终句子。
计算第二语言的所述多个候选句子的各自的分数的步骤可包括:从每个翻译处理计算第二语言的仅单个候选句子的各自的分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710347966.6/2.html,转载请声明来源钻瓜专利网。