[发明专利]文本翻译方法、装置、可读存储介质和计算机设备有效
申请号: | 201811026196.6 | 申请日: | 2018-09-04 |
公开(公告)号: | CN109271646B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 涂兆鹏;窦子轶;王星;史树明;张潼 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30;G06F40/289;G06F40/284;G06F40/126;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;何平 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 翻译 方法 装置 可读 存储 介质 计算机 设备 | ||
本申请涉及一种文本翻译方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取源文本的词序列;通过机器翻译模型中编码器的多层神经网络,逐层对所述词序列进行语义编码,得到源端融合向量序列;所述源端融合向量序列融合了各层神经网络所输出的源端向量序列;通过所述机器翻译模型的解码器,根据所述机器翻译模型前次输出的目标词的词向量,对所述源端融合向量序列进行解码,得到当次的目标端向量序列;根据所述目标端向量序列,确定所述机器翻译模型当次输出的目标词;根据所述机器翻译模型输出的各目标词,生成所述源文本对应的目标文本。本申请提供的方案可以提高文本翻译质量。
技术领域
本申请涉及机器学习技术领域,特别是涉及一种文本翻译方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着机器学习技术的发展,出现了机器翻译技术。在现有的机器翻译领域,通常采用深层神经网络来进行文本翻译,常用的深层神经网络比如,循环神经网络、卷积神经网络、以及自注意力机制网络等。传统的通过神经网络模型来进行文本翻译,通常会使用编码-解码框架,也就是根据由多层神经网络构成的编码器、以及由多层神经网络构成的解码器而组成的框架。
然而,使用传统的神经网络翻译框架来进行文本翻译,通常仅仅利用了编码器和解码器中最上层神经网络的信息,使得文本翻译准确率不高。
发明内容
基于此,有必要针对文本翻译准确率低的技术问题,提供一种文本翻译方法、装置、计算机可读存储介质和计算机设备。
一种文本翻译方法,包括:
获取源文本的词序列;
通过机器翻译模型中编码器的多层神经网络,逐层对所述词序列进行语义编码,得到源端融合向量序列;所述源端融合向量序列融合了各层神经网络所输出的源端向量序列;
通过所述机器翻译模型的解码器,根据所述机器翻译模型前次输出的目标词的词向量,对所述源端融合向量序列进行解码,得到当次的目标端向量序列;
根据所述目标端向量序列,确定所述机器翻译模型当次输出的目标词;
根据所述机器翻译模型输出的各目标词,生成所述源文本对应的目标文本。
一种文本翻译装置,所述装置包括:
获取模块,用于获取源文本的词序列;
编码模块,用于通过机器翻译模型中编码器的多层神经网络,逐层对所述词序列进行语义编码,得到源端融合向量序列;所述源端融合向量序列融合了各层神经网络所输出的源端向量序列;
解码模块,用于通过所述机器翻译模型的解码器,根据所述机器翻译模型前次输出的目标词的词向量,对所述源端融合向量序列进行解码,得到当次的目标端向量序列;
确定模块,用于根据所述目标端向量序列,确定所述机器翻译模型当次输出的目标词;
生成模块,用于根据所述机器翻译模型输出的各目标词,生成所述源文本对应的目标文本。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述文本翻译方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述文本翻译方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811026196.6/2.html,转载请声明来源钻瓜专利网。