[发明专利]一种基于流生成模型的语音合成方法在审
申请号: | 202110855783.1 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113299268A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈佩云;曹艳艳;高君效 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G06N3/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于流生成模型的语音合成方法,训练过程包括以下步骤:S11.将训练音频文本输入编码器网络,得到当前分布参数、当前隐向量、当前对齐矩阵;S12.对时长模型进行训练更新;S13.完成解码器网络和编码器网络更新;S14利用更新后的编码器网络和解码器网络;重复步骤S11至S13,直至时长模型、编码器网络和解码器网络均达到收敛。本发明利用流生成模型动态规划的特性,可自行搜索文本和语音之间的潜在表示的最有可能的单调对齐以实现高鲁棒性的语音合成,克服了在合成时可能出现的多字漏字的情况,并且能够扩展到长语音的合成。同时,利用基于流的并行生成模型可以实现快速,可控的语音合成。 | ||
搜索关键词: | 一种 基于 生成 模型 语音 合成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110855783.1/,转载请声明来源钻瓜专利网。
- 上一篇:执法记录仪系统和流程
- 下一篇:一种隔离功耗调整电路