[发明专利]语音合成方法、系统、设备及存储介质有效
申请号: | 202010182535.0 | 申请日: | 2020-03-16 |
公开(公告)号: | CN113409756B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 杨辰雨;雷鸣 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08;G10L19/04;G10L19/16;G10L25/03;G10L25/30 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 系统 设备 存储 介质 | ||
本申请实施例提供一种语音合成方法、系统、设备及存储介质。在本申请实施例中,提供一种多通道线性预测网络声码器,支持多通道输入,通过获取待合成文本在多个通道上的声学特征,利用该多通道线性预测网络声码器可合成出该待合成文本对应的语音信号;其中,基于线性预测进行语音合成可保证语音合成质量,与此同时,借助于多通道的优势可提高语音合成效率。
技术领域
本申请涉及语音信号处理技术领域,尤其涉及一种语音合成方法、系统、设备及存储介质。
背景技术
语音合成,又称文本语音转换(Text to Speech)技术,是通过机械的、电子的方法产生人造语音的技术。在语音合成过程中,前端和中端负责从文本预测语音的压缩特征,如梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)等;而由这些压缩特征到合成可测听的语音由声码器(vocoder)来完成。
线性预测网络(Linear Prencdictive Coding Net,LPCNet)声码器,是一种结合了循环神经网络(Recurrent Neural Network,RNN)和线性预测的WaveRNN的变种模型,它将深度学习和数字信号处理技术结合起来,大幅度地提升了语音合成质量,因此在语音合成系统中得到广泛应用。但是,现有LPCNet存在一定的计算冗余度,合成效率较低。
发明内容
本申请的多个方面提供一种多通道信号处理方法、系统、设备及存储介质,用以在保证语音合成质量的情况下,提升语音合成效率。
本申请实施例提供一种语音合成方法,包括:获取待合成文本在多个通道上的声学特征,不同通道对应不同声学频带;利用结合了线性预测编码的神经网络对所述多个通道上的声学特征进行预测,得到所述多个通道上的线性预测参数和非线性残差;根据所述多个通道的上的线性预测参数和非线性残差进行语音合成,得到所述待合成文本对应的合成语音。
本申请实施例还提供一种多通道线性预测网络声码器,包括:支持多通道输入的帧速率网络、多个线性预测编码器LPC、支持多通道输入的采样率网络以及合成网络;所述帧速率网络,用于接收待合成文本在多个通道上的声学特征,对所述多个通道上的声学特征以帧为单位进行特征转换得到条件向量,并将所述条件向量输出至所述采样率网络;所述多个LPC,用于对所述多个通道上的声学特征分别进行线性预测编码,得到多个通道上的线性预测参数,并输出至所述采样率网络和所述合成网络;所述采样率网络,用于基于所述条件向量和所述多个通道上的线性预测参数,预测所述多个通道上的非线性残差,并输出至所述合成网络;所述合成网络,用于根据所述多个通道上的线性预测参数和非线性残差进行语音合成,得到所述待合成文本对应的合成语音。
本申请实施例还提供一种语音合成设备,包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器与所述存储器耦合,用于执行所述计算机程序,以用于:获取待合成文本在多个通道上的声学特征,不同通道对应不同声学频带;利用结合了线性预测编码的神经网络对所述多个通道上的声学特征进行预测,得到所述多个通道上的线性预测参数和非线性残差;根据所述多个通道的上的线性预测参数和非线性残差进行语音合成,得到所述待合成文本对应的合成语音。
本申请实施例还提供一种语音合成方法,包括:接收终端设备发送的语音合成请求,所述语音合成请求包含待合成文本;对所述待合成文本进行特征提取,得到所述待合成文本在多个通道上的声学特征;利用结合了线性预测编码的神经网络对所述多个通道上的声学特征进行预测,得到所述多个通道上的线性预测参数和非线性残差;根据所述多个通道的上的线性预测参数和非线性残差进行语音合成,得到所述待合成文本对应的合成语音;以及将所述待合成语音返回给所述终端设备,以供所述终端设备输出所述合成语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182535.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:检测装置及光刻设备
- 下一篇:一种实现废旧线路板无氧裂解的回收方法