[发明专利]语音识别系统中的说话人自适应方法无效
申请号: | 03102206.5 | 申请日: | 2003-01-27 |
公开(公告)号: | CN1521728A | 公开(公告)日: | 2004-08-18 |
发明(设计)人: | 吴及;王作英;吕萍 | 申请(专利权)人: | 北京天朗语音科技有限公司;清华大学 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/14;G10L15/06 |
代理公司: | 北京万慧达知识产权代理有限公司 | 代理人: | 秦开宗 |
地址: | 100029北京市朝阳区裕民*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种语音识别系统中的说话人自适应方法,称为最大高斯相似度协方差矩阵线性插值方法,能够克服基于高斯相似度的二叉决策树方法中在自适应数据极少的情况下的缺点。本发明主要步骤是:自适应前,首先与基于高斯相似度分析的二叉决策树自适应方法一样,根据非特定人模型建立起协方差矩阵二叉决策树;然后,按照该决策树计算在各特定人模型下中间节点对应的类中心矩阵。自适应时,先由测试者提供的数据量决定,在哪些中间节点上进行插值自适应,接着根据每一待插值的中间节点对应的自适应数据,计算插值系数,最后计算自适应后的类中心矩阵,更新协方差矩阵,得到自适应模型。 | ||
搜索关键词: | 语音 识别 系统 中的 说话 自适应 方法 | ||
【主权项】:
1、一种语音识别系统中的说话人自适应方法,包括:一个自适应前非特定人隐含马尔可夫模型的训练步骤;一个自适应前建立该非特定人隐含马尔可夫模型状态协方差矩阵的二叉决策树的步骤;一个自适应前计算二叉决策树每个中间节点的类中心协方差矩阵及其与对应的各叶子节点协方差矩阵间的变换关系的步骤;一个自适应时根据测试者提供的自适应数据决定自适应类的步骤;一个对每个自适应类根据自适应数据用最大似然方法估计类中心矩阵的步骤;一个对每个自适应类计算自适应后的类中心协方差矩阵的步骤;一个更新每个自适应类的协方差矩阵,得到说话人自适应模型的步骤;其特征在于:所述的语音识别系统中的说话人自适应方法还包括:一个自适应前多个特定人隐含马尔可夫模型的训练步骤;一个自适应前根据所述二叉决策树计算在各特定人模型下中间节点对应的类中心矩阵的步骤;一个自适应时对每个自适应类计算最优插值系数的步骤;所述的对每个自适应类计算自适应后的类中心协方差矩阵的步骤是以特定人模型类中心矩阵的最大似然估计值和其对应插值系数计算的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天朗语音科技有限公司;清华大学,未经北京天朗语音科技有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03102206.5/,转载请声明来源钻瓜专利网。