[发明专利]一种基于流生成模型的语音合成方法在审

申请号：	202110855783.1	申请日：	2021-07-28
公开（公告）号：	CN113299268A	公开（公告）日：	2021-08-24
发明（设计）人：	陈佩云;曹艳艳;高君效	申请（专利权）人：	成都启英泰伦科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08;G06N3/08;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	610041 四川省成都市高***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于流生成模型的语音合成方法，训练过程包括以下步骤：S11.将训练音频文本输入编码器网络，得到当前分布参数、当前隐向量、当前对齐矩阵；S12.对时长模型进行训练更新；S13.完成解码器网络和编码器网络更新；S14利用更新后的编码器网络和解码器网络；重复步骤S11至S13，直至时长模型、编码器网络和解码器网络均达到收敛。本发明利用流生成模型动态规划的特性，可自行搜索文本和语音之间的潜在表示的最有可能的单调对齐以实现高鲁棒性的语音合成，克服了在合成时可能出现的多字漏字的情况，并且能够扩展到长语音的合成。同时,利用基于流的并行生成模型可以实现快速，可控的语音合成。
搜索关键词：	一种基于生成模型语音合成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司，未经成都启英泰伦科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202110855783.1/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载