[发明专利]基于生成参数听感误差最小化的模型自适应方法无效
申请号: | 200710191077.1 | 申请日: | 2007-12-06 |
公开(公告)号: | CN101178895A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 秦龙;凌震华;胡郁;胡国平;吴晓如;刘庆峰;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 参数 误差 最小化 模型 自适应 方法 | ||
1.基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的方法包括有以下步骤实现:
(1)利用原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵生成对自适应数据的文本进行合成时使用的声学参数;
(2)利用原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计自适应数据的声学参数;根据自适应数据对应的文本以及相关的上下文信息以及原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵,估计与自适应数据的声学参数各帧相对应的用于合成语音的估计的声学参数;
(3)综合出自适应数据的声学参数与估计的声学参数之间的听感误差计算公式;
(4)以听感误差计算公式计算由自适应数据文本依据原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计生成的声学参数与自适应数据声学参数之间的听感误差;
(5)以最大似然线性回归算法得到的转换矩阵为初值,利用梯度下降算法,通过逐次迭代的方法,更新原始说话人模型到目标说话人模型的转换矩阵,以保证每次迭代后自适应数据对应的生成参数听感误差的逐渐降低;得到最小化听感误差;
(6)最终将得到的转换矩阵应用于原始说话人的声学模型,实现基于生成参数听感误差最小化的模型自适应过程。
2.根据权利要求1所述的基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的步骤(1)中是利用自适应数据,计算原始说话人到目标说话人的转换矩阵。
3.根据权利要求2所述的基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的原始说话人到目标说话人的转换矩阵,由最大似然线性回归模型自适应算法计算得出。
4.根据权利要求1所述的基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的步骤(2)中自适应数据的声学参数,采用下式得出:
C=[c1,c2,...,cT]
其中C为自适应数据的声学参数,T为总帧数;所述的步骤(2)中估计的声学参数,采用下式得出:
其中为估计的声学参数,T为总帧数。
5.根据权利要求4所述的基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的建模采用的声学参数为线谱频率参数,即:
Ct=[lsft,1,...,lsft,N]
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710191077.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸和虹膜混合识别的新方法-识别层融合
- 下一篇:承压式太阳能供热系统