[发明专利]一种数据处理方法及装置有效
申请号: | 201910469361.3 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110188367B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 李长亮;李国良;郭馨泽;唐剑波 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/30;G06F16/36;G06N3/0455;G06N3/0464;G06N3/0442;G06N3/048 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,用于翻译模型,所述翻译模型包括编码器和解码器,所述解码器包括至少一个解码层;
对于每个解码层,所述方法包括:
根据输入的参考待解码向量进行计算,得到第一子层向量,根据输入的所述编码器的编码向量和所述参考待解码向量进行基本注意力计算,得到第二子层向量,其中,所述编码向量为所述编码器对原始语句进行编码后生成的向量;
将所述第一子层向量和所述第二子层向量进行融合,得到融合向量;
将所述融合向量进行线性变换,得到输出的解码向量;
将所述解码层的最终解码向量依次输入线性层和归一化层,获得翻译结果。
2.如权利要求1所述的数据处理方法,其特征在于,对于第一个解码层;
根据输入的参考待解码向量进行计算,得到第一子层向量,根据输入的所述编码器的编码向量和所述参考待解码向量进行基本注意力计算,得到第二子层向量,包括:
根据输入的初始待解码向量作为参考待解码向量进行计算,得到第一子层向量,根据输入的初始待解码向量与所述编码向量进行基本注意力计算,得到第二子层向量;
或
根据输入的解码器的前一个最终解码向量作为参考待解码向量进行计算,得到第一子层向量,根据输入的解码器的前一个最终解码向量与所述编码向量进行基本注意力计算,得到第二子层向量。
3.如权利要求1所述的数据处理方法,其特征在于,对于除去第一个解码层的其他解码层,
根据输入的参考待解码向量进行计算,得到第一子层向量,根据输入的所述编码器的编码向量和所述参考待解码向量进行基本注意力计算,得到第二子层向量,包括:
根据输入的上一个解码层的解码向量进行计算,得到所述第一子层向量;
根据输入的所述编码器的编码向量和上一个解码层的解码向量进行基本注意力计算,得到所述第二子层向量。
4.如权利要求1所述的数据处理方法,其特征在于,所述解码器包括n个低阶的解码层和m个高阶的解码层,其中,n和m均为正整数;
对于低阶的解码层,根据输入的参考待解码向量进行计算,得到第一子层向量,包括:根据输入的参考待解码向量进行深度可分离卷积计算,得到所述第一子层向量;
对于高阶的解码层,根据输入的参考待解码向量进行计算,得到第一子层向量,包括:根据输入的参考待解码向量进行自注意力计算,得到所述第一子层向量。
5.如权利要求1所述的数据处理方法,其特征在于,将所述第一子层向量和所述第二子层向量进行融合,得到融合向量,包括:
将所述第一子层向量和所述第二子层向量进行拼接;
将拼接后的所述第一子层向量和所述第二子层向量赋权重值,然后通过激活函数进行计算,得到第一激活向量和第二激活向量;
根据所述第一子层向量和所述第一激活向量以及所述第二子层向量和所述第二激活向量进行计算,得到所述融合向量。
6.如权利要求1所述的数据处理方法,其特征在于,还包括:
将最后一个解码层作为解码器的最终解码向量;或
根据所有解码层的解码向量进行计算,得到解码器的最终解码向量。
7.一种数据处理装置,其特征在于,用于翻译模型,所述翻译模型包括编码器和解码器,所述解码器包括至少一个解码层;
对于每个解码层,所述装置包括:
计算模块,被配置为根据输入的参考待解码向量进行计算,得到第一子层向量,根据输入的所述编码器的编码向量和所述参考待解码向量进行基本注意力计算,得到第二子层向量,其中,所述编码向量为所述编码器对原始语句进行编码后生成的向量;
融合模块,被配置为将所述第一子层向量和所述第二子层向量进行融合,得到融合向量;
线性变换模块,被配置为将所述融合向量进行线性变换,得到输出的解码向量,将所述解码层的最终解码向量依次输入线性层和归一化层,获得翻译结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910469361.3/1.html,转载请声明来源钻瓜专利网。