[发明专利]一种基于深度学习的有声书韵律语音合成方法在审
申请号: | 202211685174.7 | 申请日: | 2022-12-27 |
公开(公告)号: | CN116072100A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 林伟;钟巧霞;曾碧;林镇涛 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L13/047 | 分类号: | G10L13/047;G10L13/10;G10L25/18 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 江金城 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的有声书韵律语音合成方法,首先,通过说话人编码器模块,提取参考音频的音频特征;其次,将待合成音频文本传入编码器和时长预测器并融合参考音频特征得到音频编码;接着通过韵律预测器和解码器输出合成音频频谱;最后,通过声码器将频谱转化为合成音频。本发明通过引入轻量卷积、韵律预测器,结合音素持续时长和音素韵律特征进行模型的训练,控制生成音频的全局韵律,解决发音容易出现错误且发声韵律单调无变化问题。 | ||
搜索关键词: | 一种 基于 深度 学习 有声 韵律 语音 合成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211685174.7/,转载请声明来源钻瓜专利网。