[发明专利]语音合成中时长参数的生成方法有效
申请号: | 201110160419.X | 申请日: | 2011-06-15 |
公开(公告)号: | CN102222501A | 公开(公告)日: | 2011-10-19 |
发明(设计)人: | 陶建华;潘诗锋 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/06 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 梁爱荣 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 中时长 参数 生成 方法 | ||
1.语音合成中时长参数的生成方法,其特征在于,所述生成状态时长参数的步骤包括:
步骤Sa:对待合成的文本进行文本分析,提取与HMM模型相关的上下文特征信息以及与时长整体方差模型相关的上下文特征信息,根据整体方差建模规范中确定的上下文特征信息项对待合成文本进行与时长整体方差模型相关的上下文特征信息提取,将与HMM模型相关的上下文特征信息依序组合成为上下文相关的HMM模型序列;
步骤Sb:利用HMM状态时长模型集对上下文相关的HMM模型序列进行决策,得到HMM状态时长模型序列;
步骤Sc:利用时长整体方差模型集对提取出的时长整体方差模型相关的上下文特征信息进行决策,得到一个时长整体方差模型;
步骤Sd:通过最大化由决策出的HMM状态时长模型似然值和时长整体方差模型似然值组成的似然函数来生成最终的时长参数;其中在计算时长整体方差模型似然值时,时长整体方差值的计算需根据整体方差建模规范中确定的语音单元级别来生成该语音单元级别上的时长整体方差值。
2.如权利要求1所述的语音合成中时长参数的生成方法,其特征在于:构建时长整体方差模型的步骤包括:
创建时长整体方差模型训练语料库,选择合适的时长整体方差建模规范,利用时长整体方差分析器从训练语料库中生成时长整体方差训练样本;
训练生成时长整体方差模型是利用全部时长整体方差训练样本进行时长整体方差模型的估计;
基于HMM状态时长模型和训练得到的时长整体方差模型执行生成状态时长参数。
3.根据权利要求1所述的语音合成中时长参数的生成方法,其特征在于,所述选择合适的时长整体方差建模规范是确定时长整体方差建模的语音单元级别;确定与时长整体方差相关的上下文特征信息项。
4.根据权利要求2所述的语音合成中时长参数的生成方法,其特征在于,所述时长整体方差训练样本是对每个训练语句根据整体方差建模规范中确定的语音单元级别生成该语音单元级别上的时长整体方差值;根据整体方差建模规范中确定的上下文特征信息项生成每个训练语句的上下文特征信息。
5.根据权利要求1所述的语音合成中时长参数的生成方法,其特征在于,所述时长整体方差模型训练是生成一组上下文相关的时长整体方差模型集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110160419.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于平衡电极内浆和陶瓷膜收缩率的MLCC电容器
- 下一篇:一种显示器节能方法