[发明专利]机器翻译方法、机器翻译模型的训练方法、装置及设备在审
申请号: | 202011126789.7 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112163435A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 颜建昊;孟凡东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/211;G06N3/08;G06N3/04 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 徐立 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 模型 训练 装置 设备 | ||
1.一种机器翻译方法,其特征在于,所述方法包括:
获取源端句子经过嵌入编码后的编码词向量;
对所述编码词向量进行映射处理,得到映射后的中间向量;
根据所述映射后的中间向量之间的依赖关系,对所述映射后的中间向量进行拟合处理,得到拟合后的向量,所述依赖关系用于表征所述源端句子中的词语之间的关联关系;
对所述拟合后的向量进行解码处理,输出所述源端句子经过翻译后的目标端句子。
2.根据权利要求1所述的方法,其特征在于,所述方法由机器翻译模型执行,所述机器翻译模型包括N层级联的编码层,第1层编码层的输入是所述编码词向量,第k层编码层的输出向量是第k+1层编码层的输入向量,所述第k层编码层包括第k层映射单元和第k层顺序依赖单元,k为正整数且k的初始值为2;
所述对所述编码词向量进行映射处理,得到映射后的中间向量;根据所述映射后的中间向量之间的依赖关系,对所述映射后的中间向量进行拟合处理,得到拟合后的向量,包括:
调用第k+1层映射单元对第k层顺序依赖单元输出的拟合向量进行所述映射处理,输出映射后的第一中间向量;
调用第k+1层顺序依赖单元获取所述映射后的第一中间向量之间的所述依赖关系,并根据所述依赖关系对所述映射后的第一中间向量进行所述拟合处理,输出所述第k+1层编码层对应的第一拟合向量;
重复执行上述输出所述映射后的第一中间向量的步骤和输出所述第一拟合向量的步骤,直到第N层编码层输出所述拟合后的向量;其中,N为正整数,且k≤N。
3.根据权利要求2所述的方法,其特征在于,所述第k+1层顺序依赖单元包括第k+1层排序单元和第k+1层依赖单元;
所述调用第k+1层顺序依赖单元获取所述映射后的第一中间向量之间的所述依赖关系,并根据所述依赖关系对所述映射后的第一中间向量进行所述拟合处理,输出第一拟合向量,包括:
调用所述第k+1层排序单元对所述映射后的第一中间向量进行排序,输出排序后的第一中间向量;
调用所述第k+1层依赖单元对所述排序后的第一中间向量构建所述依赖关系;
调用所述第k+1层依赖单元根据所述依赖关系对所述排序后的第一中间向量进行所述拟合处理,输出所述第一拟合向量。
4.根据权利要求3所述的方法,其特征在于,所述第k+1层排序单元包括I个并列相连的排序单元,所述第k+1层依赖单元包括I个并列相连的依赖单元,所述排序后的第一中间向量包括第一子向量和第二子向量,所述第一子向量是所述第k+1层排序单元中的第i个排序单元输出的向量,所述第二子向量是所述第k+1层排序单元中的第i+1个排序单元输出的向量,所述第i个排序单元的输出向量是第i个依赖单元的输入向量;第1个依赖单元的输出向量是对第1个排序单元的输出向量拟合后得到的;
所述调用所述第k+1层依赖单元根据所述依赖关系对所述排序后的第一中间向量进行所述拟合处理,输出所述第一拟合向量,包括:
调用所述第i个依赖单元和第i+1个依赖单元获取所述第一子向量和第二子向量之间的依赖关系;
调用第i+1个依赖单元对所述第一子向量和所述第二子向量进行所述拟合处理,输出第三子向量;
重复上述获取所述第一子向量和所述第二子向量之间的依赖关系的步骤,以及输出所述第三子向量的步骤,直到所述I个依赖单元输出所述第k+1层依赖单元对应的所述第一拟合向量,所述第一拟合向量包括所述第三子向量,其中,I和i均为正整数,且i≤I。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011126789.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种紫丹活血滴丸及其制备方法
- 下一篇:一种互动式英语教学装置