[发明专利]语音合成方法、装置、电子设备和存储介质在审

申请号：	202210749829.6	申请日：	2022-06-28
公开（公告）号：	CN115171644A	公开（公告）日：	2022-10-11
发明（设计）人：	贺来朋;周鸿斌;叶剑豪;吕翔;印晶晶;汤宗锦;浦晟骄;赵光程;卢恒	申请（专利权）人：	上海喜马拉雅科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08;G10L25/03;G10L21/013
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	张欣欣
地址：	201100 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及语音处理技术领域，提供一种语音合成方法、装置、电子设备和存储介质。电子设备预存有用户的标识及其对应的音色特征和预设转换模型；获取用户输入的待合成文本和用户的标识，并基于用户的标识获取对应的音色特征和预设转换模型；然后利用预设合成模型对待合成文本进行语音合成，得到待转换音频；再利用预设转换模型基于音色特征对待转换音频进行音色转换，得到符合用户音色的音频。通过预设合成模型得到包含文本内容的音频，并通过预设转换模型将该音频进行音色转换得到包含文本内容且符合用户音色的音频。从而提升了合成效果和音频质量。

技术领域

本发明涉及语音处理技术领域，具体而言，涉及一种语音合成方法、装置、电子设备和存储介质。

背景技术

目前，基于语音合成技术，用户可以输入文本得到自己朗读这段文本的音频，实现这一功能需要用户的语音数据。但是，由于用户提供的语音往往音质不高且数据量少，所以会出现语音合成的效果不佳，合成音频质量差的情况。

发明内容

有鉴于此，本发明的目的在于提供一种语音合成方法、装置、电子设备和存储介质。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明提供一种语音合成方法，应用于电子设备，所述电子设备预存有用户的标识及其对应的音色特征和预设转换模型，所述方法包括：

获取所述用户输入的待合成文本和所述用户的标识；

基于所述用户的标识获取对应的音色特征和预设转换模型；

利用预设合成模型对所述待合成文本进行语音合成，得到待转换音频；

利用所述预设转换模型基于所述音色特征对所述待转换音频进行音色转换，得到符合所述用户音色的音频。