[发明专利]语音合成模型生成方法和装置有效
申请号: | 201710897311.6 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107452369B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 李昊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/00 | 分类号: | G10L13/00;G10L13/08;G10L25/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 模型 生成 方法 装置 | ||
本申请公开了语音合成模型生成方法和装置。该方法的一具体实施方式包括:获取用于对语音合成模型对应的神经网络进行训练的文本的文本特征和文本对应的语音的声学特征,其中,声学特征中的用于训练的文本对应的语音的基频数据通过基频数据提取模型提取,基频数据提取模型基于利用包含的每一帧语音均对应有基频数据的语音预先对基频数据提取模型对应的神经网络进行训练而生成;利用文本特征和声学特征对语音合成模型对应的神经网络进行训练。实现了利用预先训练的基频数据提取模型提取用于训练的段语音的基频数据,使得用于训练语音的完整的基频数据可以用于对语音合成模型对应的神经网络的训练,进而提升训练效果。
技术领域
本申请涉及计算机领域,具体涉及语音领域,尤其涉及语音合成模型生成方法和装置。
背景技术
在对语音合成模型对应的神经网络进行训练过程中,需要利用用于训练的语音的声学特征,对于声学特征中的语音的基频数据,目前,通常是采用数学变换的方式提取语音中的基频数据。
采用数学变换的方式提取语音中的基频数据会出现一段语音中的部分语音段的基频数据难以提取出的情况,导致用于训练的语音的基频数据不是完整的语音的基频数据,进而影响语音合成模型对应的神经网络进行训练的训练效果。
发明信息
本申请提供了一种语音合成模型生成方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了语音合成模型生成方法,该方法包括:获取用于对语音合成模型对应的神经网络进行训练的文本的文本特征和文本对应的语音的声学特征,其中,所述声学特征中的用于训练的文本对应的语音的基频数据通过基频数据提取模型提取,所述基频数据提取模型基于利用包含的每一帧语音均对应有基频数据的语音预先对基频数据提取模型对应的神经网络进行训练而生成;利用所述文本的文本特征和文本对应的语音的声学特征对语音合成模型对应的神经网络进行训练。
第二方面,本申请提供了语音合成模型生成装置,该装置包括:获取单元,配置用于获取用于对语音合成模型对应的神经网络进行训练的文本的文本特征和文本对应的语音的声学特征,其中,所述声学特征中的用于训练的文本对应的语音的基频数据通过基频数据提取模型提取,所述基频数据提取模型基于利用包含的每一帧语音均对应有基频数据的语音预先对基频数据提取模型对应的神经网络进行训练而生成;训练单元,配置用于利用所述文本的文本特征和文本对应的语音的声学特征对语音合成模型对应的神经网络进行训练。
本申请提供的语音合成模型生成方法和装置,通过获取用于对语音合成模型对应的神经网络进行训练的文本的文本特征和文本对应的语音的声学特征,其中,所述声学特征中的用于训练的文本对应的语音的基频数据通过基频数据提取模型提取,所述基频数据提取模型基于利用包含的每一帧语音均对应有基频数据的语音预先对基频数据提取模型对应的神经网络进行训练而生成;利用所述文本的文本特征和文本对应的语音的声学特征对语音合成模型对应的神经网络进行训练。实现了利用预先训练的指示语音的特征与基频数据的特征的对应关系的基频数据提取模型提取用于训练的段语音的基频数据,使得用于训练语音的完整的基频数据可以用于对语音合成模型对应的神经网络的训练,进而提升训练效果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了根据本申请的语音合成模型生成方法的一个实施例的流程图;
图2示出了根据本申请的语音合成模型生成装置的一个实施例的结构示意图;
图3示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710897311.6/2.html,转载请声明来源钻瓜专利网。