[发明专利]语音合成方法、装置、电子设备及计算机可读存储介质有效

申请号：	202010078708.4	申请日：	2020-02-03
公开（公告）号：	CN111292715B	公开（公告）日：	2023-04-07
发明（设计）人：	胡居成	申请（专利权）人：	北京奇艺世纪科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/04;G10L13/08
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	莎日娜
地址：	100080 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置电子设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种语音合成方法、装置、电子设备及计算机可读存储介质，属于计算机技术领域。该方法中，会根据待合成文本中不同片段的语义，将待合成文本划分为多个待合成子文本，根据预训练的语音参数预测模型，生成每个待合成子文本对应的语音参数，基于每个待合成子文本对应的语音参数，生成每个待合成子文本对应的语音片段，将对应的语音片段组合为待合成文本对应的合成语音。本发明实施例中，基于预训练的语音参数预测模型为待合成子文本生成的语音参数，来生成对应的语音片段，可以使得生成的对应的语音片段更加生动，进而可以提高语音合成的效果。

技术领域

本发明涉及计算机技术领域，特别是涉及一种语音合成方法、装置、电子设备及计算机可读存储介质。

背景技术

为了提高方便用户获取文本中的信息，经常需要将文本合成为语音，以供用户通过收听语音的方式，获取到该文本中的信息。

相关技术中，往往是按照固定的语音参数，利用语音转换技术，将该文本转换为语音参数与该固定的语音参数匹配的语音。

由于合成后的语音参数是固定，这样，使得合成后的语音对该文本的表现效果较为生硬，语音合成的效果较差。

发明内容

本发明实施例的目的在于提供一种语音合成方法、装置、电子设备及计算机可读存储介质，以实现解决合成后的语音对文本的表现效果较为生硬，语音合成的效果较差的问题。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种语音合成方法，所述方法包括：

根据待合成文本中不同片段的语义，将所述待合成文本划分为多个待合成子文本；

根据预训练的语音参数预测模型，生成每个待合成子文本对应的语音参数；

基于每个待合成子文本对应的语音参数，生成每个待合成子文本对应的语音片段；