[发明专利]语音合成模型的确定方法、装置、设备和存储介质有效

申请号：	202110831297.6	申请日：	2021-07-22
公开（公告）号：	CN113689844B	公开（公告）日：	2022-05-27
发明（设计）人：	陆嘉盛;高正坤;孙晨曦;孙涛	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G10L13/047	分类号：	G10L13/047;G10L13/08;G10L19/22;G10L25/30;G10L25/24
代理公司：	北京鸿德海业知识产权代理有限公司 11412	代理人：	田宏宾
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成模型确定方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种语音合成模型的确定方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及语音合成、深度学习等人工智能领域。语音合成模型的确定方法包括：基于待采用语音合成模型，对文本进行处理，以获得所述文本对应的音频；若所述音频的音频指标不符合预设标准，更新所述待采用语音合成模型，直至所述音频指标符合所述预设标准；基于所述音频指标符合所述预设标准时的待采用语音合成模型，确定最终语音合成模型。本公开可以提高语音合成模型的确定速度。

技术领域

本公开涉及计算机技术领域，具体涉及语音合成、深度学习等人工智能领域，尤其涉及一种语音合成模型的确定方法、装置、设备和存储介质。

背景技术

语音合成(Text to Speech，TTS)是指将文本转换为音频。语音合成一般采用语音合成模型对文本进行处理，以获得文本对应的音频。

相关技术中，一般采用人工评测的方式选择语音合成模型。

发明内容

本公开提供了一种语音合成模型的确定方法、装置、设备和存储介质。

根据本公开的一方面，提供了一种语音合成模型的确定方法，包括：基于待采用语音合成模型，对文本进行处理，以获得所述文本对应的音频；若所述音频的音频指标不符合预设标准，更新所述待采用语音合成模型，直至所述音频指标符合所述预设标准；基于所述音频指标符合所述预设标准时的待采用语音合成模型，确定最终语音合成模型。

根据本公开的另一方面，提供了一种语音合成模型的确定装置，包括：处理模块，用于基于待采用语音合成模型，对文本进行处理，以获得所述文本对应的音频；更新模块，用于若所述音频的音频指标不符合预设标准，更新所述待采用语音合成模型，直至所述音频指标符合所述预设标准；确定模块，用于基于所述音频指标符合所述预设标准时的待采用语音合成模型，确定最终语音合成模型。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。

根据本公开的技术方案，可以提高语音合成模型的确定速度。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开第一实施例的示意图；

图2是根据本公开第二实施例的示意图；

图3是根据本公开第三实施例的示意图；

图4是根据本公开第四实施例的示意图；

图5是根据本公开第五实施例的示意图；