[发明专利]一种提高语音合成效果的方法和设备有效
申请号: | 202110268228.9 | 申请日: | 2021-03-12 |
公开(公告)号: | CN113053354B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 周瑜秋;孙见青;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 语音 合成 效果 方法 设备 | ||
1.一种提高语音合成效果的方法,其特征在于,应用于Parallel WaveGAN,所述Parallel WaveGAN中包括生成器;该方法包括:
获取所述Parallel WaveGAN中生成器的语音信号;
获取原始语音信号;
对所述生成器的语音信号与所述原始语音信号进行小波变换处理;
对进行小波变换处理后的信号进行损失计算;
将计算得到的损失作为所述生成器的损失的一部分,以使所述生成器更好的捕捉语音信号的时频分布,从而提升合成效果;
所述小波变换处理包括对所述生成器的语音信号与所述原始语音信号进行多层分解;所述损失计算包括对分解后的每层进行损失计算;每层损失计算得到每层损失;所述“将计算得到的损失作为所述生成器损失的一部分”,包括:汇总每层损失作为小波变换损失;将小波变换损失作为所述生成器损失的一部分。
2.如权利要求1所述的方法,其特征在于,所述Parallel WaveGAN中还包括识别器;所述识别器对所述原始语音信号进行识别时,对应有识别损失;
所述生成器的损失由小波变换损失与所述识别损失组成。
3.如权利要求1所述的方法,其特征在于,所述小波变换处理包括:离散小波变换处理。
4.如权利要求1或3所述的方法,其特征在于,所述“对所述生成器的语音信号与所述原始语音信号进行小波变换处理”,包括:
将所述生成器的语音信号与所述原始语音信号进行滤波处理,以得到最上层的细节信号和近似信号;
对上一层中近似信号进行滤波处理,得到当前层的细节信号和近似信号;
重复执行”对上一层中近似信号进行滤波处理,得到当前层的细节信号和近似信号“得到多层处理后的信号。
5.一种提高语音合成效果的设备,其特征在于,应用于Parallel WaveGAN,所述Parallel WaveGAN中包括生成器;该设备包括:
第一获取模块,用于获取所述Parallel WaveGAN中生成器的语音信号;
第二获取模块,用于获取原始语音信号;
小波变换处理模块,用于对所述生成器的语音信号与所述原始语音信号进行小波变换处理;
损失计算模块,用于对进行小波变换处理后的信号进行损失计算;
提升模块,用于将计算得到的损失作为所述生成器的损失的一部分,以使所述生成器更好的捕捉语音信号的时频分布,从而提升合成效果;
所述小波变换处理包括对所述生成器的语音信号与所述原始语音信号进行多层分解;所述损失计算包括对分解后的每层进行损失计算;每层损失计算得到每层损失;所述提升模块“将计算得到的损失作为所述生成器损失的一部分”,包括:汇总每层损失作为小波变换损失;将小波变换损失作为所述生成器损失的一部分。
6.如权利要求5所述的设备,其特征在于,所述Parallel WaveGAN中还包括识别器;所述识别器对所述原始语音信号进行识别时,对应有识别损失;
所述生成器的损失由小波变换损失与所述识别损失组成。
7.如权利要求5所述的设备,其特征在于,所述小波变换处理包括:离散小波变换处理。
8.如权利要求5或7所述的设备,其特征在于,所述小波变换处理模块,用于:
将所述生成器的语音信号与所述原始语音信号进行滤波处理,以得到最上层的细节信号和近似信号;
对上一层中近似信号进行滤波处理,得到当前层的细节信号和近似信号;
重复执行”对上一层中近似信号进行滤波处理,得到当前层的细节信号和近似信号“得到多层处理后的信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268228.9/1.html,转载请声明来源钻瓜专利网。