[发明专利]并行语音合成方法、装置、设备以及计算机可读存储介质在审
申请号: | 201910569448.8 | 申请日: | 2019-06-27 |
公开(公告)号: | CN112151003A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 王文富;孙晨曦;孙涛;陈熙;王桂彬;贾磊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L25/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉;丁君军 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 并行 语音 合成 方法 装置 设备 以及 计算机 可读 存储 介质 | ||
本公开提供了一种并行语音合成方法、装置、设备以及计算机可读存储介质。方法包括将一段文本拆分成多个片段,然后根据这段文本获得多个片段的用于循环神经网络的多个初始隐状态。方法还包括基于多个初始隐状态和多个片段的输入特征,并行合成多个片段。本公开的实施例在使用循环神经网络并行合成多个片段的过程中,通过隐状态预测模型为每个片段提供初始隐状态,不仅能够提升语音合成的速度,实现实时的语音合成,而且能够缓解片段之间的隐状态中断,由此保证合成语音的质量。
技术领域
本公开的实施例总体上涉及语音合成技术领域,并且更具体地涉及使用循环神经网络(RNN)来并行合成语音的方法、装置、设备以及计算机可读存储介质。
背景技术
语音合成是指将文本转化为语音的技术,又称为文本转语音(Text-to-Speech,TTS)。通常,语音合成技术通过计算机将文本信息转换为音质好且自然流畅度高的语音信息。语音合成是智能语音交互技术的核心技术之一,与语音识别技术共同构成智能语音交互中的不可缺少的部分。
传统的语音合成主要包括基于声码器参数的语音合成方法和基于单元挑选拼接的语音合成方法。一般来说,语音合成的质量(包括音质和自然流畅度)直接影响用户的听感以及相关产品的用户体验。近年来,随着深度学习技术的发展以及在语音合成领域的广泛应用,语音合成的音质和自然流畅度都得到了明显的提升。此外,随着智能硬件的迅速普及,使用语音合成获取信息的场景也变得越来越丰富。目前,语音合成已经广泛应用于语音播报、地图导航、智能客服、智能音箱等领域和产品。
发明内容
根据本公开的示例实施例,提供了一种并行语音合成方法、装置、设备以及计算机可读存储介质。
在本公开的第一方面中,提供了一种并行语音合成方法。该方法包括:将一段文本拆分成多个片段;基于一段文本,获得多个片段的用于循环神经网络的多个初始隐状态;以及基于多个初始隐状态和多个片段的输入特征,并行合成多个片段。
在本公开的第二方面中,提供了一种并行语音合成装置。该装置包括:片段拆分模块,被配置为将一段文本拆分成多个片段;隐状态获得模块,被配置为基于一段文本,获得多个片段的用于循环神经网络的多个初始隐状态;以及并行语音合成模块,被配置为基于多个初始隐状态和多个片段的输入特征,并行合成多个片段。
在本公开的第三方面中,提供了一种电子设备,其包括一个或多个处理器以及存储器,其中存储器用于存储一个或多个程序。一个或多个程序当被一个或多个处理器执行,使得电子设备实现根据本公开的实施例的方法或过程。
在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的实施例的方法或过程。
应当理解,本发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了根据本公开的实施例的示例并行语音合成场景的示意图;
图2示出了根据本公开的实施例的并行语音合成方法的流程图;
图3示出了根据本公开的实施例的基于片段的隐状态连续来并行实时语音合成多个片段的过程的示意图;
图4示出了根据本公开的实施例的以自回归方式串行合成每个片段的过程的示意图;
图5示出了根据本公开的实施例的基于RNN的语音合成系统的示例架构的示意图;
图6示出了根据本公开的实施例的基于RNN的语音合成系统的训练过程的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910569448.8/2.html,转载请声明来源钻瓜专利网。