[发明专利]一种机器翻译方法及装置有效
申请号: | 201910557372.7 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110263353B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 李长亮;郭馨泽;唐剑波;王怡然 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器翻译 方法 装置 | ||
本申请提供一种机器翻译方法及装置。所述机器翻译方法,包括:获取待翻译语句;获取预先通过编码单元处理得到的背景知识向量集;将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。本申请提供的机器翻译方法及装置,通过将待翻译语句与背景知识相结合,以避免在翻译的过程中由于文化等差异带来的影响,提高翻译结果的准确性和贴合度。
技术领域
本申请涉及计算机技术领域,特别涉及一种机器翻译方法、装置、计算设备、计算机可读存储介质及芯片。
背景技术
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。
目前,机器翻译通常采用编码器-解码器框架,编码器负责将源语言句子压缩为语义空间中的一个向量,期望该向量包含源语言句子的主要信息;解码器将编码器提供的语义向量,作为输入,不断迭代,产生在语义上等价的目标端句子,即机器翻译结果。
在机器翻译过程中,如何确定与源语言对应更为准确的目标语言是机器翻译一直需要解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种机器翻译方法、装置、计算设备、计算机可读存储介质及芯片,以解决现有技术中存在的技术缺陷。
本申请实施例公开了一种机器翻译方法,包括:
获取待翻译语句;
获取预先通过编码单元处理得到的背景知识向量集;
将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;
将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。
进一步地,在获取待翻译语句之前,还包括:
获取背景知识,并将所述背景知识输入至编码单元进行处理,得到背景知识向量集。
进一步地,所述编码单元包括知识嵌入层和卷积神经网络层,所述将所述背景知识输入至编码单元进行处理,得到背景知识向量集,包括:
将所述背景知识输入至所述知识嵌入层进行处理,得到知识嵌入层的输出向量集;
将所述知识嵌入层的输出向量集输入至所述卷积神经网络层进行处理,得到所述背景知识向量集。
进一步地,所述编码器包括n个顺次连接的翻译编码层,其中,n≥1,且n为整数;
所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:
S11、将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量;
S12、判断第i个翻译编码层的输出向量是否与所述背景知识向量集进行融合处理以及i是否等于n,其中,1≤i≤n,且i为整数;
S13、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量作为第一编码向量;
S14、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量输入至第i+1层,并将i+1赋值给i,执行步骤S12;
S15、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量作为第一编码向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910557372.7/2.html,转载请声明来源钻瓜专利网。