[发明专利]语音的合成方法及装置、存储介质、电子装置在审
申请号: | 201810462450.0 | 申请日: | 2018-05-15 |
公开(公告)号: | CN110556092A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 解俊;朱杰;汤梦;李斌 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 11240 北京康信知识产权代理有限责任公司 | 代理人: | 董文倩;江舟 |
地址: | 518057 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感特征 韵律参数 转换规则 语音 合成 参数转换 存储介质 电子装置 情感语音 映射关系 语音合成 | ||
本发明提供了一种语音的合成方法及装置、存储介质、电子装置,其中,该方法包括:获取第一语音的情感特征参数;根据转换规则将情感特征参数转换为韵律参数,其中,转换规则用于描述情感特征参数与韵律参数的映射关系;根据韵律参数和第一语音合成第二语音。通过本发明,解决了相关技术中合成情感语音过于复杂的技术问题。
技术领域
本发明涉及通信领域,具体而言,涉及一种语音的合成方法及装置、存储介质、电子装置。
背景技术
语音合成技术的使用场合非常广泛,但通常的语音合成技术一般只能产生中性语音(即无情感语音),不能适用于一些需要包含情感的场合,如:诗歌、小说等的数字朗读,在一些需要语音提醒的场合,如:手机终端的语音提示、汽车驾驶的语音提示等,如果采用了情感语音,则更接近人类的交互特点,更具亲和力。
相关技术中的情感语音合成方法通常是由情感语音字段拼接合成的,这种方法要提供所需情感的语音数据库,然后将情感语段进行拼接,形成情感语音。具体就是需要一个庞大的情感语音库,并且不同的情感需要分别对应一个语音库,再依据已有的韵律规则进行合成,然后再在此基础上通过一定的算法进行情感语音韵律参数的调节,由此来对语音单元进行波形拼接,合成出对应的情感语句。相关技术中在确定语音参数时,都是通过人工调试来完成。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种语音的合成方法及装置、存储介质、电子装置。
根据本发明的一个实施例,提供了一种语音的合成方法,包括:获取第一语音的情感特征参数;根据转换规则将所述情感特征参数转换为韵律参数,其中,所述转换规则用于描述所述情感特征参数与所述韵律参数的映射关系;根据所述韵律参数和所述第一语音合成第二语音。
根据本发明的另一个实施例,提供了一种语音的合成装置,包括:获取模块,用于获取第一语音的情感特征参数;转换模块,用于根据转换规则将所述情感特征参数转换为韵律参数,其中,所述转换规则用于描述所述情感特征参数与所述韵律参数的映射关系;合成模块,用于根据所述韵律参数和所述第一语音合成第二语音。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,通过使用转换规则将情感特征参数转换为韵律参数,并合成得到第二语音,第二语音在播放时具备韵律感,从而实现在携带语音中携带情感,解决了相关技术中合成情感语音过于复杂的技术问题,简化了情感语音的合成系统,提高了情感语音的合成效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种语音的合成方法的移动终端的硬件结构框图;
图2是根据本发明实施例的语音的合成方法的流程图;
图3是根据本发明实施例的语音的合成装置的结构框图;
图4是本发明实施例基于PSOLA方法的情感语音转换系统的结构示意图;
图5为本实施例平滑地近似任意形状的概率密度分布示意图;
图6是本实施例三个高斯概率密度函数的加权和对某种分布进行拟合示意图。
图7是本发明实施例基于GMM的韵律特征参数确定流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810462450.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息提供装置
- 下一篇:一种语音标注方法及其系统