[发明专利]一种语音合成方法、装置及存储介质有效
申请号: | 202011619349.5 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112863477B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 殷昊;陈云琳;江明奇;杨喜鹏;张旭 | 申请(专利权)人: | 出门问问(苏州)信息科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/18;G10L25/30 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 刘婧 |
地址: | 215000 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 合成 方法 装置 存储 介质 | ||
1.一种语音合成方法,其特征在于,所述方法包括:
将原始语音信号按频率分解成n个子带频率信号,n的取值为大于等于2的正整数;
从所述原始语音信号提取梅尔频谱特征;
根据所提取的梅尔频谱特征生成所述n个子带频率信号中每个子带频率信号的预测采样点;
利用所述n个子带频率信号中每个子带频率信号的预测采样点对所述n个子带频率信号进行合成,得到对应所述原始语音信号的语音合成信号;
其中,根据所提取的梅尔频谱特征对所述n个子带频率信号进行线性预测,得到所述n个子带频率信号中每个子带频率信号对应的线性预测值;
利用所提取的梅尔频谱特征对所述n个子带频率信号进行神经网络预测,得到所述n个子带频率信号中每个子带频率信号对应的残差;
将所述n个子带频率信号中每个子带频率信号对应的线性预测值和残差对应相加,得到所述n个子带频率信号中每个子带频率信号的预测采样点。
2.根据权利要求1所述的方法,其特征在于,利用所述n个子带频率信号中每个子带频率信号的预测采样点对所述n个子带频率信号进行合成,得到对应所述原始语音信号的语音合成信号,包括:
根据所述n个子带频率信号中每个子带频率信号对应的线性预测值和残差,生成n个子带语音合成信号;
将所述n个子带语音合成信号按频率合并,得到对应所述原始语音信号的语音合成信号。
3.根据权利要求1所述的方法,其特征在于,根据所提取的梅尔频谱特征对所述n个子带频率信号进行线性预测,包括:
将所提取的梅尔频谱特征转换为线性谱;
将所述线性谱等分成n个子带线性谱;
对所述n个子带线性谱进行线性预测,得到每个子带线性谱对应的线性预测系数;
根据所述线性预测系数确定所述n个子带频率信号中每个子带频率信号对应的线性预测值。
4.根据权利要求1所述的方法,其特征在于,利用所提取的梅尔频谱特征对所述n个子带频率信号进行神经网络预测,包括:
利用梅尔频谱样本和所述n个子带频率信号进行模型训练,得到神经网络模型;
将所提取的梅尔频谱特征作为所述神经网络模型的输入,对所述n个子带频率信号进行神经网络预测。
5.一种语音合成装置,其特征在于,所述装置包括:
信号分解模块,用于将原始语音信号按频率分解成n个子带频率信号,n的取值为大于等于2的正整数;
特征提取模块,用于从所述原始语音信号提取梅尔频谱特征;
采样点生成模块,用于根据所提取的梅尔频谱特征生成所述n个子带频率信号中每个子带频率信号的预测采样点;
信号合成模块,用于利用所述n个子带频率信号中每个子带频率信号的预测采样点对所述n个子带频率信号进行合成,得到对应所述原始语音信号的语音合成信号;
所述采样点生成模块具体用于,根据所提取的梅尔频谱特征对所述n个子带频率信号进行线性预测,得到所述n个子带频率信号中每个子带频率信号对应的线性预测值;利用所提取的梅尔频谱特征对所述n个子带频率信号进行神经网络预测,得到所述n个子带频率信号中每个子带频率信号对应的残差;将所述n个子带频率信号中每个子带频率信号对应的线性预测值和残差对应相加,得到所述n个子带频率信号中每个子带频率信号的预测采样点。
6.根据权利要求5所述的装置,其特征在于,
所述信号合成模块具体用于,根据所述n个子带频率信号中每个子带频率信号对应的线性预测值和残差,生成n个子带语音合成信号;将所述n个子带语音合成信号按频率合并,得到对应所述原始语音信号的语音合成信号。
7.根据权利要求6所述的装置,其特征在于,
所述采样点生成模块,还用于将所提取的梅尔频谱特征转换为线性谱;将所述线性谱等分成n个子带线性谱;对所述n个子带线性谱进行线性预测,得到每个子带线性谱对应的线性预测系数;根据所述线性预测系数确定所述n个子带频率信号中每个子带频率信号对应的线性预测值。
8.一种计算机可读存储介质,其特征在于,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行权利要求1至4任一项所述语音合成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问(苏州)信息科技有限公司,未经出门问问(苏州)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011619349.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:充电灯
- 下一篇:一种用于更换控制棒组件移动体的旋转式换料专用结构