[发明专利]基于生成参数听感误差最小化的模型自适应方法无效

专利信息
申请号: 200710191077.1 申请日: 2007-12-06
公开(公告)号: CN101178895A 公开(公告)日: 2008-05-14
发明(设计)人: 秦龙;凌震华;胡郁;胡国平;吴晓如;刘庆峰;王仁华 申请(专利权)人: 安徽科大讯飞信息科技股份有限公司
主分类号: G10L13/02 分类号: G10L13/02;G10L13/04;G10L13/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 230088安徽省合肥*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及基于生成参数听感误差最小化的模型自适应方法,其方法包括结合听感实验确定合理的声学参数听感距离计算方式;依据原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计的声学参数,计算其相对于自适应数据声学参数的听感距离;基于听感误差最小化对原始说话人模型到目标说话人模型的转换矩阵进行逐次的迭代调整至最佳转换效果。本发明针对现有技术的缺陷,其目的就是为了提供一种用于说话人转换的基于生成参数听感误差最小化的模型自适应方法,减小听感误差,以提高说话人转换效果。
搜索关键词: 基于 生成 参数 误差 最小化 模型 自适应 方法
【主权项】:
1.基于生成参数听感误差最小化的模型自适应方法,其特征在于所述的方法包括有以下步骤实现:(1)利用原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵生成对自适应数据的文本进行合成时使用的声学参数;(2)利用原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计自适应数据的声学参数;根据自适应数据对应的文本以及相关的上下文信息以及原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵,估计与自适应数据的声学参数各帧相对应的用于合成语音的估计的声学参数;(3)综合出自适应数据的声学参数与估计的声学参数之间的听感误差计算公式;(4)以听感误差计算公式计算由自适应数据文本依据原始说话人的声学模型和原始说话人模型到目标说话人模型的转换矩阵估计生成的声学参数与自适应数据声学参数之间的听感误差;(5)以最大似然线性回归算法得到的转换矩阵为初值,利用梯度下降算法,通过逐次迭代的方法,更新原始说话人模型到目标说话人模型的转换矩阵,以保证每次迭代后自适应数据对应的生成参数听感误差的逐渐降低;得到最小化听感误差;(6)最终将得到的转换矩阵应用于原始说话人的声学模型,实现基于生成参数听感误差最小化的模型自适应过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200710191077.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top