[发明专利]语音机器翻译模型的构建方法及语音机器翻译装置在审
申请号: | 202111294802.4 | 申请日: | 2021-11-03 |
公开(公告)号: | CN114021585A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 刘宇宸;周玉 | 申请(专利权)人: | 北京中科凡语科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F16/332;G06F16/33 |
代理公司: | 北京庚致知识产权代理事务所(特殊普通合伙) 11807 | 代理人: | 韩德凯 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 机器翻译 模型 构建 方法 装置 | ||
1.一种语音机器翻译模型的构建方法,其特征在于,包括:
构建语音机器翻译模型的预目标函数,所述预目标函数表征预测概率分布与真实数据分布之间的交叉熵,基于源语言语音-目标语言文本的数据集以及所述预目标函数对语音机器翻译模型进行训练,获取所述语音机器翻译模型的预测概率分布;
将所述源语言语音-目标语言文本组成的数据集中的源语言语音转录文本作为源语言文本构建源语言文本-目标语言文本的数据集;
构建文本机器翻译模型的目标函数,所述目标函数表征预测概率分布与真实数据分布之间的交叉熵,基于所述源语言文本-目标语言文本的数据集以及所述目标函数对文本机器翻译模型进行训练,获取所述文本机器翻译模型的预测概率分布;
将所述语音机器翻译模型的预测概率分布与所述文本机器翻译模型的预测概率分布之间的交叉熵作为所述语音机器翻译模型的最终目标函数;以及
基于所述最终目标函数对所述语音翻译模型进行训练,最小化所述语音机器翻译模型的预测概率分布与所述文本机器翻译模型的预测概率分布之间的交叉熵,获得构建后的语音机器翻译模型。
2.根据权利要求1所述的语音机器翻译模型的构建方法,其特征在于,基于源语言语音-目标语言文本的数据集以及所述预目标函数对语音机器翻译模型进行训练,获取所述语音机器翻译模型的预测概率分布,包括:
最小化所述语音机器翻译模型的预测概率分布与真实数据分布之间的交叉熵,以获得所述语音机器翻译模型的预测概率分布。
3.根据权利要求1或2所述的语音机器翻译模型的构建方法,其特征在于,基于所述源语言文本-目标语言文本的数据集以及所述目标函数对文本机器翻译模型进行训练,获取所述文本机器翻译模型的预测概率分布,包括:
最小化所述文本机器翻译模型的预测概率分布与真实数据分布之间的交叉熵,以获得所述文本机器翻译模型的预测概率分布。
4.根据权利要求3所述的语音机器翻译模型的构建方法,其特征在于,所述文本机器翻译模型的预测概率分布为对于所述源语言文本-目标语言文本的数据集中的源语言文本的各个时刻预测出的词语的概率分布。
5.根据权利要求4所述的语音机器翻译模型的构建方法,其特征在于,将源语言文本-目标语言文本的数据集中的源语言文本的各个时刻预测出的词语的概率分布作为基于所述最终目标函数对所述语音翻译模型进行训练的训练目标。
6.根据权利要求5中任一项所述的语音机器翻译模型的构建方法,其特征在于,所述文本机器翻译模型包括第一Transformer模型,所述语音机器翻译模型包括第二Transformer模型;所述第一Transformer模型与所述第二Transformer模型均包括多层堆叠的编码器以及多层堆叠的解码器。
7.根据权利要求6所述的语音机器翻译模型的构建方法,其特征在于,基于所述源语言文本-目标语言文本的数据集以及所述目标函数对文本机器翻译模型进行训练,包括:
将源语言文本词向量序列通过词嵌入被映射至连续的空间表示并作为所述第一Transformer模型的编码器的输入,编码器将所述源语言文本词向量序列编码至连续表示,所述第一Transformer模型的解码器基于所述连续表示输出目标语言文本词向量序列;以及
以最小化所述文本机器翻译模型的最大似然损失为训练目标。
8.一种语音翻译装置,包括:
语音机器翻译模型,所述语音机器翻译模型为权利要求1至7中任一项所述的语音机器翻译模型的构建方法构建的语音机器翻译模型;以及
文本机器翻译模型,所述文本机器翻译模型用于所述语音机器翻译模型的构建。
9.一种电子设备,其特征在于,包括:
存储器,所述存储器存储执行指令;以及
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行权利要求1至7中任一项所述的方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现权利要求1至7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科凡语科技有限公司,未经北京中科凡语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111294802.4/1.html,转载请声明来源钻瓜专利网。