[发明专利]基于顺句驱动的语言转换方法和装置有效
申请号: | 201911324032.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111079450B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张睿卿;张传强;熊皓;何中军;吴华;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 戎郑华 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 驱动 语言 转换 方法 装置 | ||
1.一种基于顺句驱动的语言转换方法,其特征在于,包括:
利用预设的编码器,将待转换的源语句进行编码处理,确定所述源语句对应的第一向量及第二向量;
依据预设的规则,确定当前的掩码向量,其中,所述掩码向量用于对所述编码器输出的向量进行修正,所述掩码向量表示为[-c,-c,…,-c,0,0,…,0,-c,-c,…,-c],其中,c为整数,元素0前面-c的数量为L1,连续为0的元素的数量为L2,元素0后面-c的数量为L3,其中,L1+L2+L3=L,L为所述源语句中字符的数量;
根据位于第一源字符前的各源字符分别对应的目标语言字符,确定第三向量,其中,第一源字符为当前待翻译的源字符;
利用预设的解码器,将所述第一向量、第二向量、掩码向量及第三向量进行解码处理,生成与所述第一源字符对应的目标字符。
2.如权利要求1所述的方法,其特征在于,所述依据预设的规则,确定当前的掩码向量,包括:
根据所述第一源字符在所述源语句中的位置及所述源语句中包括的字符数量,确定当前的掩码向量中各取值元素的数量。
3.如权利要求1所述的方法,其特征在于,所述依据预设的规则,确定当前的掩码向量,包括:
根据所述第一源字符在所述源语句中的位置、所述源语句中包括的字符数量及已经生成的目标语言字符的数量,确定当前的掩码向量中各取值元素的数量。
4.如权利要求1所述的方法,其特征在于,所述依据预设的规则,确定当前的掩码向量,包括:
依据预设的规则,确定当前的至少两组掩码向量;
所述利用预设的解码器,将所述第一向量、第二向量、掩码向量及第三向量进行解码处理,生成与所述第一源字符对应的目标字符,包括:
利用预设的解码器,将所述至少两组掩码向量,分别与所述第一向量、第二向量、及第三向量进行解码处理,生成与所述第一源字符对应的至少两个候选目标语言字符;
从所述至少两个候选目标语言字符中选取注意力值最大的字符,作为所述第一源字符对应的目标字符。
5.如权利要求1所述的方法,其特征在于,所述将所述第一向量、第二向量、掩码向量及第三向量输入预设的解码器进行解码处理,生成与所述第一源字符对应的目标字符,包括:
将所述第一向量与所述第三向量的转置向量进行叉乘,生成叉乘向量;
将所述掩码向量与所述叉乘向量求和,生成第四向量;
对所述第四向量及所述第二向量进行多头注意力计算,生成与所述第一源字符对应的注意力值;
将所述注意力值进行解码处理,确定所述第一源字符对应的目标字符。
6.如权利要求1-5任一所述的方法,其特征在于,所述将待转换的源语句进行编码处理,确定所述源语句对应的第一向量及第二向量,包括:
将所述待转换的源语句进行向量映射,确定所述源语句对应的源向量;
对所述源向量进行多头注意力计算及线性变换处理,生成所述源向量对应的第一向量及第二向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911324032.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车用包边机构
- 下一篇:基于看板拉动实现生产订单交付的方法及装置