[发明专利]翻译方法和装置有效
申请号: | 201510450967.4 | 申请日: | 2015-07-28 |
公开(公告)号: | CN105117389B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 李伟;胡晓光;蓝翔 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 方法 装置 | ||
技术领域
本发明涉及语言处理技术领域,尤其涉及一种翻译方法和装置。
背景技术
机器翻译的目标是给定某种语言的文本,由机器将其自动翻译成另一种语言的形式。比如,用户输入了一段中文:“北京的出租车司机很热情”,机器翻译系统可以将其自动翻译为英文或其它语言的文字。
现有技术中,存在很多机器翻译的方法,循环神经网络(Recurrent Neural Network;以下简称:RNN)是其中的一种。RNN是一种统计翻译的方法,其翻译的主体过程可以被视为一个搜索过程:机器通过某种方式“理解”了用户的输入之后,在英文词空间中搜索:找到多种可能的翻译候选,并为每个翻译候选给出一个概率得分。最后,选择其中得分最高的一个或多个候选,将其作为翻译结果返回。
相比其他的机器翻译方法,RNN的翻译质量较好,但RNN存在的问题是计算量大,需要相对较长的时间才能完成翻译。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种翻译方法。该方法可以改进RNN的搜索过程,减少扩展的候选词的个数,从而提升搜索速度,减少翻译用时。
本发明的第二个目的在于提出一种翻译装置。
为了实现上述目的,本发明第一方面实施例的翻译方法,包括:获取队列中得分最高的候选词,对所述得分最高的候选词进行扩展;从所述得分最高的候选词的扩展结果与所述得分最高的候选词对应栈的下一栈已有的候选词中,选择得分最高的N个候选词,N≥2,N为整数;将选择的N个候选词保存在所述得分最高的候选词对应栈的下一栈中,并更新所述队列中的候选词。
本发明实施例的翻译方法,获取队列中得分最高的候选词,对得分最高的候选词进行扩展,从所述得分最高的候选词的扩展结果与上述得分最高的候选词对应栈的下一栈已有的候选词中,选择得分最高的N个候选词,然后将选择的N个候选词保存在上述得分最高的候选词对应栈的下一栈中,并更新上述队列中的候选词,由于每次仅对队列中得分最高的候选词进行扩展,因此可以改进RNN的搜索过程,减少扩展的候选词的个数,提升了搜索速度,减少了翻译用时。
为了实现上述目的,本发明第二方面实施例的翻译装置,包括:获取模块,用于获取队列中得分最高的候选词;扩展模块,用于对所述获取模块获取的得分最高的候选词进行扩展;选择模块,用于从所述得分最高的候选词的扩展结果与所述得分最高的候选词对应栈的下一栈已有的候选词中,选择得分最高的N个候选词,N≥2,N为整数;保存模块,用于将所述选择模块选择的N个候选词保存在所述得分最高的候选词对应栈的下一栈中;更新模块,用于更新所述队列中的候选词。
本发明实施例的翻译装置,获取模块获取队列中得分最高的候选词,扩展模块对得分最高的候选词进行扩展,选择模块从上述得分最高的候选词的扩展结果与上述得分最高的候选词对应栈的下一栈已有的候选词中,选择得分最高的N个候选词,然后保存模块将选择的N个候选词保存在上述得分最高的候选词对应栈的下一栈中,并由更新模块更新上述队列中的候选词,由于每次仅对队列中得分最高的候选词进行扩展,因此可以改进RNN的搜索过程,减少扩展的候选词的个数,提升了搜索速度,减少了翻译用时。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明翻译方法一个实施例的流程图;
图2为本发明翻译方法另一个实施例的流程图;
图3为本发明翻译方法再一个实施例的流程图;
图4为本发明翻译方法的翻译过程一个实施例的示意图;
图5为本发明翻译装置一个实施例的结构示意图;
图6为本发明翻译装置另一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1为本发明翻译方法一个实施例的流程图,如图1所示,该翻译方法可以包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510450967.4/2.html,转载请声明来源钻瓜专利网。