[发明专利]一种机器翻译方法及装置有效
申请号: | 201910557372.7 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110263353B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 李长亮;郭馨泽;唐剑波;王怡然 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器翻译 方法 装置 | ||
1.一种机器翻译方法,其特征在于,包括:
获取待翻译语句;
获取预先通过编码单元处理得到的背景知识向量集;
将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量;
将所述第一编码向量输入至解码器中进行处理,得到所述待翻译语句的翻译语句。
2.根据权利要求1所述的机器翻译方法,其特征在于,在获取待翻译语句之前,还包括:
获取背景知识,并将所述背景知识输入至编码单元进行处理,得到背景知识向量集。
3.根据权利要求2所述的机器翻译方法,其特征在于,所述编码单元包括知识嵌入层和卷积神经网络层,所述将所述背景知识输入至编码单元进行处理,得到背景知识向量集,包括:
将所述背景知识输入至所述知识嵌入层进行处理,得到知识嵌入层的输出向量集;
将所述知识嵌入层的输出向量集输入至所述卷积神经网络层进行处理,得到所述背景知识向量集。
4.根据权利要求1所述的机器翻译方法,其特征在于,所述编码器包括n个顺次连接的翻译编码层,其中,n≥1,且n为整数;
所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:
S11、将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量;
S12、判断第i个翻译编码层的输出向量是否与所述背景知识向量集进行融合处理以及i是否等于n,其中,1≤i≤n,且i为整数;
S13、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量作为第一编码向量;
S14、在所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理得到的融合向量输入至第i+1层,并将i+1赋值给i,执行步骤S12;
S15、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i等于n的情况下,将所述第i个翻译编码层的输出向量作为第一编码向量;
S16、在所述第i个翻译编码层的输出向量与所述背景知识向量集不进行融合处理且i小于n的情况下,将所述第i个翻译编码层的输出向量输入至第i+1层,并将i+1赋值给i,执行上述判断步骤S12。
5.根据权利要求4所述的机器翻译方法,其特征在于,所述编码器还包括源嵌入层,所述翻译编码层包括自注意力层和前馈神经网络层,所述将所述待翻译语句转换为语句向量,并将所述语句向量输入至第1个翻译编码层进行处理,得到第1个翻译编码层的输出向量,包括:
将所述待翻译语句输入至所述源嵌入层进行处理,得到所述语句向量;
将所述语句向量输入至所述自注意力层进行处理,得到所述自注意力层的输出向量;
将所述自注意力层的输出向量输入至所述前馈神经网络层进行处理,得到所述第1个翻译编码层的输出向量。
6.根据权利要求4所述的机器翻译方法,其特征在于,所述背景知识向量集包括至少一个背景知识向量,将所述第i个翻译编码层的输出向量与所述背景知识向量集进行融合处理,得到融合向量,包括:
计算所述第i个翻译编码层的输出向量和所述背景知识向量集中的每一个所述背景知识向量之间的相关度;
基于所述相关度为每一个所述背景知识向量配置相关度权重;
基于所述背景知识向量的相关度权重,将所述第i个翻译编码层的输出向量与所述背景知识向量融合,得到所述融合向量。
7.根据权利要求1所述的机器翻译方法,其特征在于,所述编码器包括所述编码单元以及一个编码层;
所述将所述待翻译语句和所述背景知识向量集通过编码器进行融合处理,得到第一编码向量,包括:
将所述待翻译语句转换为语句向量;
将所述语句向量与所述背景知识向量集输入至所述编码层中进行处理,得到所述第一编码向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910557372.7/1.html,转载请声明来源钻瓜专利网。