[发明专利]语音的合成方法及装置、存储介质、电子装置在审
申请号: | 201810462450.0 | 申请日: | 2018-05-15 |
公开(公告)号: | CN110556092A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 解俊;朱杰;汤梦;李斌 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 董文倩;江舟 |
地址: | 518057 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感特征 韵律参数 转换规则 语音 合成 参数转换 存储介质 电子装置 情感语音 映射关系 语音合成 | ||
1.一种语音的合成方法,其特征在于,包括:
获取第一语音的情感特征参数;
根据转换规则将所述情感特征参数转换为韵律参数,其中,所述转换规则用于描述所述情感特征参数与所述韵律参数的映射关系;
根据所述韵律参数和所述第一语音合成第二语音。
2.根据权利要求1所述的方法,其特征在于,在根据转换规则将所述情感特征参数转换为韵律参数之前,所述方法还包括以下之一:
训练所述转换规则;
预设所述转换规则。
3.根据权利要求2所述的方法,其特征在于,训练所述转换规则包括:
设置高斯混合模型,将多个类型的情感特征参数,多个类型的韵律参数作为标签数据输入至所述高斯混合模型,训练得到所述转换规则。
4.根据权利要求2所述的方法,其特征在于,训练所述转换规则包括:
选择高斯混合模型的初始值,并根据所述初始值的数据分布确定计算参数,其中,所述计算参数包括:权重值,期望值,方差值,模型个数;
采用最大期望EM算法估计所述初始值和所述计算参数,得到最大似然值。
5.根据权利要求3所述的方法,其特征在于,所述高斯混合模型其中一级的表达式p(x)通过以下公式表示:
其中
其中,Cm为权重值;μm为期望值,Σm为方差值,M为单高斯模型个数,x为情感特征参数值,p(x)为韵律参数值,d为常量,μ为常量,T为常量。
6.根据权利要求1所述的方法,其特征在于,根据所述韵律参数和所述第一语音合成第二语音包括以下之一:
在文本到语音TTS平台上根据所述韵律参数和所述第一语音合成第二语音;
使用基音同步叠加PSOLA算法根据所述韵律参数和所述第一语音合成第二语音。
7.根据权利要求1所述的方法,其特征在于,在根据所述韵律参数和所述第一语音合成第二语音之后,所述方法还包括:
对所述第二语音进行平滑处理,得到第三语音。
8.一种参数的确定装置,其特征在于,包括:
获取模块,用于获取第一语音的情感特征参数;
转换模块,用于根据转换规则将所述情感特征参数转换为韵律参数,其中,所述转换规则用于描述所述情感特征参数与所述韵律参数的映射关系;
合成模块,用于根据所述韵律参数和所述第一语音合成第二语音。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括以下之一:
训练模块,用于在所述合成模块根据转换规则将所述情感特征参数转换为韵律参数之前,训练所述转换规则;
设置模块,用于在所述合成模块根据转换规则将所述情感特征参数转换为韵律参数之前,预设所述转换规则。
10.根据权利要求9所述的装置,其特征在于,所述训练模块包括:
训练单元,用于设置高斯混合模型,将多个类型的情感特征参数,多个类型的韵律参数作为标签数据输入至所述高斯混合模型,训练得到所述转换规则。
11.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项中所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810462450.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息提供装置
- 下一篇:一种语音标注方法及其系统