[发明专利]一种语音合成单元时长的预测方法及装置有效
申请号: | 201110167390.8 | 申请日: | 2011-06-21 |
公开(公告)号: | CN102231276A | 公开(公告)日: | 2011-11-02 |
发明(设计)人: | 王愈;李健 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 合成 单元 预测 方法 装置 | ||
1.一种逐步线性回归的时长预测模型的训练方法,其特征在于,包括:
建立初始的线性回归的时长预测模型;
在迭代所述线性回归的时长预测模型的过程中,通过评价每轮的时长预测模型选择上下文环境参数,最终得到最优时长预测模型。
2.根据权利要求1所述的方法,其特征在于,所述在迭代所述线性回归的时长预测模型的过程中,通过评价每轮的时长预测模型选择上下文环境参数,最终得到最优时长预测模型的步骤,包括:
步骤1:选中常参数,并将其加入已选参数集;
步骤2:进行迭代,其中,在每轮迭代的过程中,在已选参数的基础上选出对进一步提升预测准确度作用最大的未选参数,并加入已选参数集;
步骤3:利用新的已选参数集,获得当前轮逐步线性回归的时长预测模型;
步骤4:判断当前轮逐步线性回归的时长预测模型是否最优,若是,则以当前逐步线性回归的时长预测模型作为逐步线性回归的最优时长预测模型,否则,返回执行步骤2。
3.根据权利要求2所述的方法,其特征在于,所述判断当前轮逐步线性回归的时长预测模型是否最优的步骤,包括:
若当前轮逐步线性回归的时长预测模型相对于上一轮逐步线性回归的时长预测模型,二者预测误差样本方差的差小于等于特定阈值,则以当前轮逐步线性回归的时长预测模型作为逐步线性回归的最优时长预测模型;
若二者预测误差样本方差的差大于特定阈值,则返回执行步骤2。
4.根据权利要求3所述的方法,其特征在于,所述线性回归的时长预测模型的表达式如下:
其中,
X为上下文环境参数矩阵,X的列数为上下文环境参数的数目,行数为语音合成单元的样本数目,X具体可以表述为:
Y为X的时长预测矩阵,Y具体可以表述为:
β为回归模型的回归系数,具体可以表述为:
ε为预测误差,具体可以表述为:
σ为ε方差的无偏估计:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110167390.8/1.html,转载请声明来源钻瓜专利网。