[发明专利]音频流的稳定实时翻译在审

专利信息
申请号: 202080004986.3 申请日: 2020-03-23
公开(公告)号: CN113498517A 公开(公告)日: 2021-10-12
发明(设计)人: 迪尔克·瑞安·帕德菲尔德 申请(专利权)人: 谷歌有限责任公司
主分类号: G06F40/58 分类号: G06F40/58;G06N3/04;G06N3/08;G06N20/00
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 周亚荣;邓聪惠
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 稳定 实时 翻译
【说明书】:

方法、系统和装置,包括编码在计算机存储介质上的计算机程序,其有助于生成以源语言记录的输入音频数据流的目标语言中的稳定实时文本翻译。获得以第一语言记录的音频流。可以生成在多个连续时间间隔的每个时间间隔处的音频的局部转录。每个局部转录可以被翻译成不同于第一语言的第二语言。可以将每个已翻译局部转录输入到模型,该模型确定输入的已翻译局部转录的一部分是否为稳定的。基于输入的已翻译局部转录,模型标识预测为稳定的已翻译局部转录的该部分。提供了已翻译局部转录的该稳定部分用于在用户设备上显示。

相关申请的交叉引用

本申请是国际申请并且要求2020年2月6日提交的美国申请No.62/970,892的权益。前述申请的公开内容通过引用整体结合于此。

背景技术

本说明书总体上涉及生成以源语言记录的输入音频数据流的目标语言的稳定实时文本翻译。

实时翻译系统旨在提供以源语言记录的音频流的目标语言的实时文本翻译。换而言之,实时翻译系统旨在当这类系统接收音频流时(或之后不久)生成音频流的文本翻译。一般而言,常规的实时系统在接收到流的部分之后不久,生成接收到的音频流的初始部分的文本翻译。当接收到该音频流的附加部分时,这些系统从流的开始直到附加部分的末尾为止生成音频的更新文本翻译。这个过程一直持续到翻译完整个音频流为止。图1示出了由常规的实时翻译系统生成的语句音频流的实时西班牙语翻译(“Set makers Feud overseat with with big orders at state”)的时间顺序列表的示例。应当指出,图1中示出的示例语句包含自动机器翻译导致的错误(原始语句所说的是“Jet makers feud over seatwidth with big orders at stake”)。

虽然常规的实时翻译系统当接收音频流时能够可视化音频流的文本翻译,但当接收到音频流的附加部分时,文本翻译通常会反复变化(在本说明书中称为“翻译闪烁”或简称为“闪烁”)。在图1中对此予以说明,其中前几个翻译中的第一个翻译词在确定词“Establecer”之前多次变化。语言之间的词序(例如,动词和形容词相对于名词的顺序)可能发生变化,因此可能发生这样的翻译闪烁。例如,现有的翻译算法通常在大致等效的词、短语和词序之间做出任意决定,并且这些决定可能随着持续接收到音频流而发生变化,因此也会发生这样的翻译闪烁。

发明内容

总体而言,本说明书中描述的主题的一个创新方面能够体现为方法,可以包括以下操作:获得音频数据流;确定记录该音频数据流中的音频的第一语言;生成在多个连续时间间隔中的每个时间间隔处的该音频的局部转录,其中,每个局部转录是:(1)从音频的开始直到特定时间间隔为止的音频的转录,并且(2)为第一语言;对于每个局部转录:将局部转录翻译成与第一语言不同的第二语言;将已翻译局部转录输入到模型,其中,该模型确定输入的已翻译局部转录的一部分是否为稳定的,其中,当输入的已翻译局部转录的一部分预期为不会在所记录音频的另一个已翻译局部转录中变化,直到比输入的局部转录的时间间隔更晚的时间间隔为止时,输入的已翻译局部转录的该部分为稳定的;通过模型且基于输入的已翻译局部转录,将已翻译局部转录的一部分标识为稳定的;以及响应于将已翻译局部转录的该部分标识为稳定的,提供已翻译局部转录的该部分用于在用户设备上显示并使用该标识。该方面的其他实施例包括被配置为执行所述方法的动作的相应系统、设备、装置和计算机程序。能够在计算机存储设备上编码计算机程序(例如,指令)。

这些及其他实施例能够各自可选地包括以下一个或多个特征。

在一些实施方式中,可以基于从以第一语言记录的一个或多个训练音频数据文件生成的转录的翻译来训练模型。

在一些实施方式中,对于每个训练音频数据文件,从一个或多个训练数据音频文件生成的转录可以包括音频数据文件的多个局部转录,训练音频数据文件的每个局部转录是在多个连续时间间隔中的相应一个处生成的,其中,每个局部转录(1)是从音频的开始直到特定时间间隔为止的音频的转录,且(2)为第一语言。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080004986.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top