[发明专利]一种降低端到端语音翻译跨模态跨语言障碍的方法及系统在审

专利信息
申请号: 202110753283.7 申请日: 2021-07-02
公开(公告)号: CN113569562A 公开(公告)日: 2021-10-29
发明(设计)人: 张婷;黄武伟;熊德意 申请(专利权)人: 中译语通科技股份有限公司
主分类号: G06F40/242 分类号: G06F40/242;G06F40/30;G06F40/42;G06F40/58;G06N3/04;G10L15/26
代理公司: 北京万贝专利代理事务所(特殊普通合伙) 11520 代理人: 马红
地址: 100131 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 降低 端到端 语音 翻译 跨模态跨 语言障碍 方法 系统
【说明书】:

发明属于语音翻译技术领域,公开了一种降低端到端语音翻译跨模态跨语言障碍的方法及系统,所述降低端到端语音翻译跨模态跨语言障碍的系统,包括语音编码器和文本解码器;所述降低端到端语音翻译跨模态跨语言障碍的方法包括:数据集以及数据处理;模型预训练;模型训练;模型解码。本发明提供的降低端到端语音翻译跨模态跨语言障碍的方法,能够使得解码端的每一层都有一个特定的声学表示,在没有引入参数和避免错误传递的情况下达到降低端到端语音翻译跨模态跨语言障碍的目的。本发明的实现以神经网络为基础,提出的降低端到端语音翻译跨模态跨语言障碍的方法旨在不引入额外参数和避免错误传递的情况下提高语音翻译的质量。

技术领域

本发明属于语音翻译技术领域,尤其涉及一种降低端到端语音翻译跨模态跨语言障碍的方法及系统。

背景技术

目前,语音翻译是研究将一种语言的语音翻译成为另一种语言的文本的一种技术,此技术有很多应用场景如:跨国会议、商业会谈、跨境客服、出国旅游,电影配音/字幕制作等。语音翻译的实现主要有两种范式--级联范式和端到端范式。传统的语音翻译是采用级联的方式,即一个语音识别模型串联一个机器翻译模型而成。随着研究技术的发展以及研究人员对于语音翻译认知的不断完善,端到端语音翻译逐渐成为研究热点。端到端语音翻译在模型上采用编码器-解码器架构,源端声学信号通过编码器得到高维声学状态,解码端根据编码得到的声学状态解码到另一种语言的文本。

语音翻译的实现会面临两个问题:一、输入的是声学信号,输出的是文本表示,即跨模态问题。一般来说,在同一个句子下,声学的表示长度要远大于文本表示。二、输入的是一种语言,输出的是另一种语言,即跨语言问题。不同语言间的差异使得解码端在生成目标词时需要找出源语言各个状态序列间全局的的信息。

语音翻译任务同时面临跨语言跨模态的问题。使得语音翻译要比跨模态任务语音识别和跨语言任务机器翻译学习更为复杂的映射关系。在端到端语音翻译上这种复杂的关系需要一步解决,这就需要大量的数据来进行学习训练。然而,由于收集音频文件以及标注的成本比较昂贵。目前端到端语音翻译的数据集很有限,数据集的规模也远小于机器翻译数据集。这使得端到端语音翻译不能很好地克服同时面临的跨模态跨语言问题。

目前使用最广泛的端到端语音翻译模型是基于Transformer结构的,由一个声学编码器和一个文本解码器组成,使用卷积神经网络(CNN)+Transformer的方式。语音特征在经过声学编码器后得到一个固定的表示,解码端的每层需要源端的信息时都是基于此固定的语音状态序列。因此语音编码器就需要有很好的表征能力,既要有声学表示能力也要有语义表示能力。在当前语音翻译数据集比较匮乏的情况下,由于训练数据量的不足导致很难得到一个好的深声学编码器。

为了进一步提高翻译质量,已有的方法包括引入其他的子模块将跨模态和跨语言问题分开看待,并运用语音识别或者机器翻译的数据来进行辅助训练。以此来得到一个比较不错的供解码使用的状态序列,达到降低跨语言跨模态障碍目的。然而,在另一方面引入了其他参数,并在不同程度上引入了错误传递。

通过上述分析,现有技术存在的问题及缺陷为:

(1)由于收集音频文件以及标注的成本比较昂贵,目前端到端语音翻译的数据集很有限,数据集的规模也远小于机器翻译数据集,这使得端到端语音翻译不能很好地克服同时面临的跨模态跨语言问题。

(2)语音编码器就需要有很好的表征能力,既要有声学表示能力也要有语义表示能力;在当前语音翻译数据集比较匮乏的情况下,由于训练数据量的不足导致很难得到一个好的深声学编码器。

(3)已有的方法包括引入其他的子模块将跨模态和跨语言问题分开看待,并运用语音识别或者机器翻译的数据来进行辅助训练,但在另一方面引入了其他参数,并在不同程度上引入了错误传递。

解决以上问题及缺陷的难度为:在当前端到端语音翻译数据集匮乏的情况下并且保持端到端语音翻译的优势下提高翻译的质量是一项极具挑战的任务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中译语通科技股份有限公司,未经中译语通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110753283.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top