[发明专利]并行神经文本到语音转换在审
申请号: | 202010518795.0 | 申请日: | 2020-06-09 |
公开(公告)号: | CN112669809A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 彭开南;平伟;宋钊;赵可心 | 申请(专利权)人: | 百度(美国)有限责任公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文提供了将文本转换为音频表示的非自回归序列到序列模型的实施例。实施例是完全卷积的,并且测试的实施例在合成时相比于现有模型获得大约46.7倍的加速,同时使用WaveNet声码器保持相当的语音质量。有趣的是,测试的实施例在挑战性测试句子上也具有比自回归模型更少的注意力误差。在一个或多个实施例中,通过应用逆自回归流(IAF)作为并行神经声码器来构建第一个全并行神经文本到语音系统。系统实施例可以通过单个前馈通路从文本合成语音。本文还公开了用于从头开始训练IAF作为原始波形的生成模型的新颖方法的实施例,其避免了对来自单独训练的WaveNet的蒸馏的需要。 | ||
搜索关键词: | 并行 神经 文本 语音 转换 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010518795.0/,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及其形成方法
- 下一篇:信号源管理系统、方法和装置