[发明专利]语音合成方法、装置、电子设备及存储介质在审
申请号: | 202210885008.5 | 申请日: | 2022-07-26 |
公开(公告)号: | CN115394283A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 李睿端;李健;陈明;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L25/30;G10L25/51;G10L15/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请是关于一种语音合成方法、装置、电子设备及可读存储介质,包括:通过获取文本数据和文本数据对应的音频数据;根据文本数据和目标音素编码获取拼接编码;将音素编码和目标音素编码进行拼接,得到拼接编码;将拼接编码输入生成模型中生成模拟音频数据,输出第一损失函数;根据第一损失函数对判别模型进行训练,得到训练后的判别模型;将模拟音频数据和所述音频数据输入训练后的判别模型进行判断;根据判断结果对生成模型进行迭代优化,直至模拟音频数据在判别模型中输出的判断结果等于预设阈值,输出目标音频数据。本申请通过生成模型和判别模型在更多的音素组合上的表现,使其更加贴近发言人的真实说话效果。 | ||
搜索关键词: | 语音 合成 方法 装置 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210885008.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种焊接用钢盘条的轧制方法
- 下一篇:一种电梯电磁感应平衡系统