[发明专利]直播语音同传方法、装置、介质及电子设备有效
申请号: | 202210167850.5 | 申请日: | 2022-02-23 |
公开(公告)号: | CN114554238B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 刘坚;李秋平;王明轩 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/2343;H04N21/4402;H04N5/278;G10L15/26;G06F40/279;G06F40/58 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 曹寒梅 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直播 语音 方法 装置 介质 电子设备 | ||
本公开涉及一种直播语音同传方法、装置、介质及电子设备,包括:获取目标语种和原始音频流数据;对原始音频流数据进行分句,并同步识别各分句语音对应的原始字幕文本;将各分句语音分别对应的原始字幕文本翻译为目标字幕文本,并根据目标字幕文本合成与分句语音对应的目标语音;将目标语音作为目标音频流数据,以构成经过同传后的直播数据。这样在同传过程中对原始音频流数据识别得到的字幕文本进行翻译时,不再逐字输入翻译引擎中,而是通过在语音识别阶段就对该原始音频流数据进行分句的处理,保证下发至下游的翻译请求中包括的是完整的分句,保证了译文的翻译效果,从而也解决了背景技术中合成语音收听效果不好的问题。
技术领域
本公开涉及直播领域,具体地,涉及一种直播语音同传方法、装置、介质及电子设备。
背景技术
目前,直播同传场景中,将直播中的原语音翻译为另一语种的语音的做法通常是基于“自动语音识别——机器翻译——机器语音合成”的处理链路,链路中的每个步骤都是逐字进行,也即,语音识别得到一个字,便输入下游的翻译模块翻译得到该字对应的翻译文本,继而根据该翻译文本合成该字对应的另一语种的语音。由于原文的识别是逐字进行了,机器翻译引擎处在原文识别引擎的下游,接收到的翻译请求是支离破碎的,经常不是完整的句子,因此将译文接入语音合成的引擎会造成译文收听的语音效果不佳。如:主讲人的话语原文为“大家好,欢迎来上海!”,译文在识别中,“大,家,好,欢,迎,来,上,海”是分别提交给翻译引擎的,语音合成时也会因为翻译引擎对该原文的逐字翻译而导致合成语音的收听效果。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种直播语音同传方法,所述方法包括:
获取目标语种和原始音频流数据,所述原始音频流数据为对直播数据解码得到;
对所述原始音频流数据进行分句,并同步识别各分句语音对应的原始字幕文本;
将各分句语音分别对应的所述原始字幕文本翻译为目标字幕文本,并根据所述目标字幕文本合成与所述分句语音对应的目标语音,所述目标字幕文本为所述目标语种的文本;
将所述目标语音作为目标音频流数据,以构成经过同传后的直播数据。
第二方面,本公开提供一种直播语音同传装置,所述装置包括:
获取模块,用于获取目标语种和原始音频流数据,所述原始音频流数据为对直播数据解码得到;
分句模块,用于对所述原始音频流数据进行分句,并同步识别各分句语音对应的原始字幕文本;
同传模块,用于将各分句语音分别对应的所述原始字幕文本翻译为目标字幕文本,并根据所述目标字幕文本合成与所述分句语音对应的目标语音,所述目标字幕文本为所述目标语种的文本;
处理模块,用于将所述目标语音作为目标音频流数据,以构成经过同传后的直播数据。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面中所述实施例中所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面中所述实施例中所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210167850.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预压压头及绑定机
- 下一篇:一种水利工程生态水情检测系统