[发明专利]波形生成方法以及相关模型的训练方法和相关设备、装置有效
申请号: | 202110056064.3 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112820267B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 伍宏传;胡亚军;江源 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/03;G10L25/18;G10L25/27 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李申 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 波形 生成 方法 以及 相关 模型 训练 设备 装置 | ||
本申请公开了一种波形生成方法以及相关模型的训练方法和相关设备、装置,其中,波形生成模型的训练方法包括:获取样本音频波形和样本音频波形的样本声学参数;其中,样本音频波形是在现实场景中采集得到的;利用样本声学参数预测得到样本初始幅度谱,并基于样本初始相位谱和样本初始幅度谱,得到样本初始波形;将样本初始波形输入波形生成模型,得到样本生成波形;基于样本生成波形和样本音频波形之间的差异,调整波形生成模型的网络参数。上述方案,能够提高波形生成的质量。
技术领域
本申请涉及语音处理技术领域,特别是涉及一种波形生成方法以及相关模型的训练方法和相关设备、装置。
背景技术
波形生成是语音处理领域中一重要分支。例如,在语音合成系统 (Text ToSpeech,TTS)中,需要通过声学参数恢复出对应的语音波形,故波形生成的质量对语音合成最终合成的语音音质具有极其重要的影响。有鉴于此,如何提高波形生成的质量成为极具研究价值的课题。
发明内容
本申请主要解决的技术问题文本是提供一种波形生成方法以及相关模型的训练方法和相关设备、装置,能够提高波形生成的质量。
为了解决上述问题文本,本申请第一方面提供了一种波形生成模型的训练方法,包括:获取样本音频波形和样本音频波形的样本声学参数;其中,样本音频波形是在现实场景中采集得到的;利用样本声学参数预测得到样本初始幅度谱,并基于样本初始相位谱和样本初始幅度谱,得到样本初始波形;将样本初始波形输入波形生成模型,得到样本生成波形;基于样本生成波形和样本音频波形之间的差异,调整波形生成模型的网络参数。
为了解决上述问题文本,本申请第二方面提供了一种波形生成方法,包括:利用目标声学参数预测得到初始幅度谱,并获取初始相位谱;基于初始幅度谱和初始相位谱,得到初始音频波形;将初始音频波形输入波形生成模型,得到目标音频波形;其中,波形生成模型是利用在现实场景中采集到的样本音频波形训练得到的。
为了解决上述问题文本,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的波形生成模型的训练方法,或实现上述第二方面中的波形生成方法。
为了解决上述问题文本,本申请第四方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的波形生成模型的训练方法,或实现上述第二方面中的波形生成方法。
上述方案,获取样本音频波形和样本音频波形的样本声学参数,且样本音频波形是在现实场景中采集得到的,并利用样本声学参数预测得到样本初始幅度谱,以及基于样本初始相位谱和样本初始幅度谱,得到样本初始波形,从而将样本初始波形输入波形生成模型,得到样本生成波形,进而基于样本生成波形和样本音频波形之间的差异,调整波形生成模型的网络参数,故此能够基于幅度谱和相位谱重建波形,并通过约束波形生成模型所生成的样本生成波形与现实场景所采集的样本音频波形之间的差异,来调整波形生成模型的网络参数,能够使得波形生成模型在训练过程学习现实场景中的样本音频波形的波形特征,从而能够有利于提高波形生成波形的准确性,进而有利于提高后续利用波形生成模型生成波形的质量。
附图说明
图1是本申请波形生成方法一实施例的流程示意图;
图2是本申请波形生成模型的训练方法一实施例的过程示意图;
图3是图1中步骤S13一实施例的流程示意图;
图4是本申请波形生成方法一实施例的流程示意图;
图5是本申请波形生成方法一实施例的过程示意图;
图6是本申请电子设备一实施例的框架示意图;
图7是本申请存储装置一实施例的框架示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110056064.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食用阿胶的加工工艺
- 下一篇:一种医疗器械精密配件的全智能气动作业工艺