[发明专利]文本到语音系统和方法以及其存储介质有效
申请号: | 201711237595.2 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108573693B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 全炳河;哈维尔·贡萨尔沃;詹竣安;扬尼斯·阿焦米尔詹纳基斯;尹炳亮;罗伯特·安德鲁·詹姆斯·克拉克;雅各布·维特 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L19/008;G10L25/30;G10L25/54 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及使用自动编码器的文本到语音合成。用于使用自动编码器的文本到语音合成的方法、系统和计算机可读介质。在一些实施方式中,获得指示用于文本到语音合成的文本的数据。提供指示文本的语言单元的数据作为对编码器的输入。编码器被配置成基于语言信息,输出指示声学特性的语音单元表示。接收编码器输出的语音单元表示。语音单元被选择以表示语言单元,语音单元基于由编码器所输出的语音单元表示从语音单元合集当中来选择。提供用于包括所选择的语音单元的文本的经合成的话语的音频数据。 | ||
搜索关键词: | 文本 语音 系统 方法 及其 存储 介质 | ||
【主权项】:
1.一种由文本到语音系统的一个或多个计算机所执行的方法,所述方法包括:由所述一个或多个计算机获得指示用于文本到语音合成的文本的数据;由所述一个或多个计算机提供指示所述文本的语言单元的数据作为对编码器的输入,所述编码器被配置成输出指示基于语言信息的声学特性的语音单元表示,其中,所述编码器被配置成提供通过机器学习训练所学习的语音单元表示;由所述一个或多个计算机接收所述编码器响应于接收作为对所述编码器的输入的指示所述语言单元的所述数据而输出的语音单元表示;由所述一个或多个计算机选择语音单元以表示所述语言单元,所述语音单元是基于由所述编码器所输出的所述语音单元表示而从语音单元合集当中被选择的;以及由所述一个或多个计算机针对包括所选择的语音单元的所述文本的合成话语提供音频数据作为所述文本到语音系统的输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711237595.2/,转载请声明来源钻瓜专利网。