[发明专利]语音合成方法、装置、电子设备及计算机可读存储介质有效
申请号: | 202010078708.4 | 申请日: | 2020-02-03 |
公开(公告)号: | CN111292715B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 胡居成 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本发明提供了一种语音合成方法、装置、电子设备及计算机可读存储介质,属于计算机技术领域。该方法中,会根据待合成文本中不同片段的语义,将待合成文本划分为多个待合成子文本,根据预训练的语音参数预测模型,生成每个待合成子文本对应的语音参数,基于每个待合成子文本对应的语音参数,生成每个待合成子文本对应的语音片段,将对应的语音片段组合为待合成文本对应的合成语音。本发明实施例中,基于预训练的语音参数预测模型为待合成子文本生成的语音参数,来生成对应的语音片段,可以使得生成的对应的语音片段更加生动,进而可以提高语音合成的效果。
技术领域
本发明涉及计算机技术领域,特别是涉及一种语音合成方法、装置、电子设备及计算机可读存储介质。
背景技术
为了提高方便用户获取文本中的信息,经常需要将文本合成为语音,以供用户通过收听语音的方式,获取到该文本中的信息。
相关技术中,往往是按照固定的语音参数,利用语音转换技术,将该文本转换为语音参数与该固定的语音参数匹配的语音。
由于合成后的语音参数是固定,这样,使得合成后的语音对该文本的表现效果较为生硬,语音合成的效果较差。
发明内容
本发明实施例的目的在于提供一种语音合成方法、装置、电子设备及计算机可读存储介质,以实现解决合成后的语音对文本的表现效果较为生硬,语音合成的效果较差的问题。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种语音合成方法,所述方法包括:
根据待合成文本中不同片段的语义,将所述待合成文本划分为多个待合成子文本;
根据预训练的语音参数预测模型,生成每个待合成子文本对应的语音参数;
基于每个待合成子文本对应的语音参数,生成每个待合成子文本对应的语音片段;
将所述对应的语音片段组合为所述待合成文本对应的合成语音;
其中,所述预训练的语音参数预测模型是基于样本文本、样本文本中不同子文本在真实语音中对应的语音片段的语音参数训练得到的;所述真实语音是对所述样本文本的表现程度满足预设要求的语音。
在本发明实施的第二方面,还提供了一种语音合成装置,所述装置包括:
第一划分模块,用于根据待合成文本中不同片段的语义,将所述待合成文本划分为多个待合成子文本;
第一生成模块,用于根据预训练的语音参数预测模型,生成每个待合成子文本对应的语音参数;
第二生成模块,用于基于每个待合成子文本对应的语音参数,生成每个待合成子文本对应的语音片段;
组合模块,用于将所述对应的语音片段组合为所述待合成文本对应的合成语音;
其中,所述预训练的语音参数预测模型是基于样本文本、样本文本中不同子文本在真实语音中对应的语音片段的语音参数训练得到的;所述真实语音是对所述样本文本的表现程度满足预设要求的语音。
在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的语音合成方法。
在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的语音合成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010078708.4/2.html,转载请声明来源钻瓜专利网。