[发明专利]基于生成参数听感误差最小化的模型自适应方法无效
申请号: | 200710191077.1 | 申请日: | 2007-12-06 |
公开(公告)号: | CN101178895A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 秦龙;凌震华;胡郁;胡国平;吴晓如;刘庆峰;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230088安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于生成参数听感误差最小化的模型自适应方法,其方法包括结合听感实验确定合理的声学参数听感距离计算方式;依据原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计的声学参数,计算其相对于自适应数据声学参数的听感距离;基于听感误差最小化对原始说话人模型到目标说话人模型的转换矩阵进行逐次的迭代调整至最佳转换效果。本发明针对现有技术的缺陷,其目的就是为了提供一种用于说话人转换的基于生成参数听感误差最小化的模型自适应方法,减小听感误差,以提高说话人转换效果。 | ||
搜索关键词: | 基于 生成 参数 误差 最小化 模型 自适应 方法 | ||
【主权项】:
1.基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的方法包括有以下步骤实现:(1)利用原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵生成对自适应数据的文本进行合成时使用的声学参数;(2)利用原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计自适应数据的声学参数;根据自适应数据对应的文本以及相关的上下文信息以及原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵,估计与自适应数据的声学参数各帧相对应的用于合成语音的估计的声学参数;(3)综合出自适应数据的声学参数与估计的声学参数之间的听感误差计算公式;(4)以听感误差计算公式计算由自适应数据文本依据原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计生成的声学参数与自适应数据声学参数之间的听感误差;(5)以最大似然线性回归算法得到的转换矩阵为初值,利用梯度下降算法,通过逐次迭代的方法,更新原始说话人模型到目标说话人模型的转换矩阵,以保证每次迭代后自适应数据对应的生成参数听感误差的逐渐降低;得到最小化听感误差;(6)最终将得到的转换矩阵应用于原始说话人的声学模型,实现基于生成参数听感误差最小化的模型自适应过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710191077.1/,转载请声明来源钻瓜专利网。
- 上一篇:人脸和虹膜混合识别的新方法-识别层融合
- 下一篇:承压式太阳能供热系统