[发明专利]语音处理系统和方法在审
申请号: | 201810145526.7 | 申请日: | 2014-08-22 |
公开(公告)号: | CN108364639A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 陈浪舟 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/07;G10L15/14 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 李峥;刘薇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种训练用于文本转语音系统的声学模型的方法,所述方法包括:接收语音数据,所述语音数据包括对应于第一语音因素的不同值的数据,并且其中所述语音数据未标记,从而对于给定的语音数据项,所述第一语音因素的值未知;根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集;以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音;其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。 | ||
搜索关键词: | 语音 语音数据 声学模型 聚簇 文本转语音系统 接收语音数据 语音处理系统 语音数据项 最大似然性 参数估计 参数集 聚类 联合 | ||
【主权项】:
1.一种文本转语音方法,其被配置为输出具有语音因素目标值的语音,所述方法包括:输入具有所述语音因素目标值的音频数据;使声学模型适应所述语音因素目标值;输入文本;将所述输入文本划分为声学单元序列;使用所述声学模型将所述声学单元序列转换为语音向量序列;以及将所述语音向量序列输出为具有所述语音因素目标值的音频,其中所述声学模型包括与所述语音因素相关的语音因素参数集,以及与所述语音因素相关的语音因素聚类集,并且其中与所述语音因素相关的所述语音因素参数集和所述语音因素聚类集未标记,从而对于给定的一个或多个聚类以及给定的一个或多个参数,与其相关的所述语音因素的值未知。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810145526.7/,转载请声明来源钻瓜专利网。