[发明专利]一种语音合成方法、装置、设备及计算机可读存储介质在审
申请号: | 202110667616.4 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113838448A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 阳珊;胡娜;李广之;苏丹 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;张颖玲 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 合成 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种语音合成方法,其特征在于,包括:
获取语句文本;其中,所述语句文本记载了等待进行语音合成的对话内容;
基于所述语句文本,构建出带有自发行为标签的文本特征;其中,所述自发行为标签指明了自发声学行为在所述对话内容中的出现位置和类型;
对所述文本特征进行特征转换,得到所述语句文本对应的声学特征;
利用所述声学特征,生成与所述语句文本对应的带有所述自发声学行为的合成语音。
2.根据权利要求1所述的方法,其特征在于,所述基于所述语句文本,构建出带有自发行为标签的文本特征,包括:
对所述语句文本所包含的每个字符信息在音素级别进行文本特征的抽取,得到所述语句文本的文本输入特征;
对所述每个字符信息在字符级别进行文本特征的提取,得到所述每个字符信息的字符特征;
对所述字符特征进行自发行为的分类,得到所述每个字符信息的行为分类结果;所述行为分类结果包括无自发行为、延音行为、停顿行为或复合行为中的任意一种,所述复合行为表征所述延音行为和所述停顿行为同时出现;
利用所述每个字符信息的所述行为分类结果和所述文本输入特征,构建出带有自发行为标签的所述文本特征。
3.根据权利要求2所述的方法,其特征在于,所述利用所述每个字符信息的所述行为分类结果和所述文本输入特征,构建出带有自发行为标签的所述文本特征,包括:
从所述每个字符信息的所述行为分类结果中,筛选出包括所述停顿行为或所述复合行为的目标行为结果;
从所述每个字符信息中,挑选出所述目标行为结果对应的目标字符信息;所述目标字符信息表征存在所述自发声学行为的字符信息;
将所述目标行为结果作为标签,添加至所述文本输入特征中与所述目标字符信息相对应的音素级文本特征中,得到带有标签的音素级文本特征;
利用所述带有标签的音素级文本特征,以及所述文本输入特征中的其他音素级文本特征,整合出带有自发行为标签的所述文本特征。
4.根据权利要求2或3所述的方法,其特征在于,所述对所述字符特征进行自发行为的分类,得到所述每个字符信息的行为分类结果之前,所述方法还包括:
从所述语句文本中,提取出韵律特征和分词特征;
所述对所述字符特征进行自发行为的分类,得到所述每个字符信息的行为分类结果,包括:
对所述每个字符信息的字符特征、所述韵律特征和所述分词特征进行自发行为的分类,得到所述每个字符信息的所述行为分类结果。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述声学特征包括:梅尔频谱;所述对所述文本特征进行特征转换,得到所述语句文本对应的声学特征,包括:
对所述文本特征进行编码,得到所述语句文本对应的音素级声学特征;
对所述音素级声学特征进行基于注意力的自回归解码,得到所述语句文本对应的所述梅尔频谱。
6.根据权利要求5所述的方法,其特征在于,所述对所述音素级声学特征进行基于注意力的自回归解码,得到所述语句文本对应的所述梅尔频谱之前,所述方法还包括:
获取所述语句文本的前置语句文本所对应的历史梅尔频谱,以及所述语句文本对应的当前对象信息;所述当前对象信息用于指示说出所述语句文本的对象;
对所述历史梅尔频谱进行上下文编码,得到上下文特征;所述上下文特征保留了所述前置语句文本的风格信息,消除了所述前置语句文本的前置对象信息,所述前置对象信息表征说出所述前置语句文本的对象的信息;
所述对所述音素级声学特征进行基于注意力的自回归解码,得到所述语句文本对应的所述梅尔频谱,包括:
对所述音素级声学特征、所述上下文特征和所述当前对象信息进行基于注意力的自回归解码,得到所述语句文本对应的所述梅尔频谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110667616.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电气绝缘监测装置
- 下一篇:语音识别方法、装置、设备及存储介质