[发明专利]语音合成模型的确定方法、装置、设备和存储介质有效
申请号: | 202110831297.6 | 申请日: | 2021-07-22 |
公开(公告)号: | CN113689844B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 陆嘉盛;高正坤;孙晨曦;孙涛 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L13/047 | 分类号: | G10L13/047;G10L13/08;G10L19/22;G10L25/30;G10L25/24 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 模型 确定 方法 装置 设备 存储 介质 | ||
1.一种语音合成模型的确定方法,包括:
基于待采用语音合成模型,对文本进行处理,以获得所述文本对应的音频;
若所述音频的音频指标不符合预设标准,更新所述待采用语音合成模型,直至所述音频指标符合所述预设标准;
基于所述音频指标符合所述预设标准时的待采用语音合成模型,确定最终语音合成模型;
其中,所述待采用语音合成模型包括待采用声学模型和待采用声码器,所述处理为至少一轮处理,所述至少一轮处理包括当前轮处理,所述基于待采用语音合成模型,对文本进行处理,以获得所述文本对应的音频,包括:
采用所述当前轮处理的待采用声学模型,对所述文本进行处理,以获得所述文本对应的声学特征;
采用所述当前轮处理的待采用声码器,对所述声学特征进行处理,以获得所述文本对应的音频。
2.根据权利要求1所述的方法,其中,所述当前轮处理的待采用声学模型为固定的声学模型,所述固定的声学模型为预设的多个声学模型中的一个声学模型,所述当前轮处理的待采用声码器为预设的多个声码器中的各个声码器,所述采用所述当前轮处理的待采用声码器,对所述声学特征进行处理,以获得所述文本对应的音频,包括:
采用所述多个声码器中的各个声码器,分别对所述固定的声学模型输出的声学特征进行处理,以获得多路音频,所述多路音频分别为所述各个声码器输出的所述文本对应的音频。
3.根据权利要求2所述的方法,其中,所述若所述音频的音频指标不符合预设标准,更新所述待采用语音合成模型,包括:
若所述多路音频的音频指标均不符合所述预设标准,在所述多路音频中选择音频指标最接近所述预设标准的音频,将所述选择的音频对应的声码器作为所述当前轮处理的下一轮处理的待采用声码器;
将所述多个声学模型中的各个声学模型作为所述当前轮处理的下一轮处理的待采用声学模型。
4.根据权利要求2所述的方法,其中,所述基于所述音频指标符合所述预设标准时的待采用语音合成模型,确定最终语音合成模型,包括:
若所述多路音频中的至少一路音频的音频指标符合所述预设标准,将符合所述预设标准的音频对应的声码器,作为当前声码器;
将所述固定的声学模型和所述当前声码器,作为所述最终语音合成模型。
5.根据权利要求1所述的方法,其中,所述当前轮处理的待采用声学模型为预设的多个声学模型中的各个声学模型,所述当前轮处理的待采用声码器为固定的声码器,所述固定的声码器为预设的多个声码器中的一个声码器;
所述采用所述当前轮处理的待采用声学模型,对所述文本进行处理,以获得所述文本对应的声学特征,包括:采用所述多个声学模型中的各个声学模型,分别对所述文本进行处理,以获得多路声学模型,所述多路声学模型为所述各个声学模型输出的所述文本对应的声学特征;
所述采用所述当前轮处理的待采用声码器,对所述声学特征进行处理,以获得所述文本对应的音频,包括:采用所述固定的声码器,分别对所述多路声学特征进行处理,以获得多路音频,所述多路音频分别对应所述多路声学特征。
6.根据权利要求5所述的方法,其中,所述若所述音频的音频指标不符合预设标准,更新所述待采用语音合成模型,包括:
若所述多路音频的音频指标均不符合所述预设标准,在所述多路音频中选择音频指标最接近所述预设标准的音频,将所述选择的音频对应的声学模型作为所述当前轮处理的下一轮处理的待采用声学模型;
将所述多个声码器中的各个声码器作为所述当前轮处理的下一轮处理的待采用声码器。
7.根据权利要求5所述的方法,其中,所述基于所述音频指标符合所述预设标准时的待采用语音合成模型,确定最终语音合成模型,包括:
若所述多路音频中的至少一路音频的音频指标符合所述预设标准,将符合所述预设标准的音频对应的声学模型,作为当前声学模型;
将所述当前声学模型和所述固定的声码器,作为所述最终语音合成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110831297.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电池信息采集装置
- 下一篇:一种自动视频追踪人员行动轨迹的系统及方法