[发明专利]一种基于非线性谱变换的特征补偿方法有效
申请号: | 201711112747.6 | 申请日: | 2017-11-13 |
公开(公告)号: | CN107919115B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 吕勇 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L15/07 | 分类号: | G10L15/07;G10L15/06;G10L15/20;G10L25/24;G10L15/14 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 非线性 变换 特征 补偿 方法 | ||
本发明公开了了一种基于非线性谱变换的特征补偿方法,在训练阶段,用大量说话人的标准语音训练生成一个高斯混合模型(GMM:Gaussian Mixture Model);在测试阶段,用各种变换参数对目标说话人每帧语音的幅度谱进行非线性频率变换,使GMM的输出概率最大,将输出概率最大时的美尔频率倒谱系数(MFCC:Mel Frequency Cepstral Coefficients)作为补偿后的目标语音特征参数。本发明可以使目标说话人的语音特性与预先训练的声学模型相匹配,减小说话人失配对语音识别系统的影响,具有实时性好,与后端识别器无关的优点。
技术领域
本发明属于语音识别领域,具体涉及到对目标说话人每帧语音的幅度谱进行非线性频率变换,使其频谱特性与预先训练的声学模型相匹配的非线性特征补偿方法。
背景技术
在语音识别系统中,作为每个语音单元声学模型的隐马尔可夫模型(HMM:HiddenMarkov Model)一般用大量说话人的语音样本训练而成。这可以覆盖大量说话人的发音特性,但也导致语音识别系统用于某一个或某一类说话人时的识别性能下降。而且,大部分说话人的发音与标准发音都有一定偏差,甚至带有严重的口音。因此,在实际应用中,就需要对目标说话人的语音特征或声学模型的参数进行补偿,减小环境失配的影响,提高语音识别系统的识别性能。
说话人自适应是一种常用的鲁棒语音识别方法,它根据测试环境下目标说话人的少量发音数据,对预先训练的声学模型的参数进行调整,使其与当前说话人的发音特性相匹配。一般来说,大词汇量语音识别系统的语音单元较多,而用于模型自适应的数据却非常有限,因此声学模型的多数高斯单元缺少足够的数据估计其均值和方差。因而,通常假设所有或部分高斯单元符合同一种线性变换,将它们的数据合并估计同一个变换矩阵,用于该类内所有高斯单元的参数变换。这就降低了说话人自适应的精度,使系统性能与用大量目标说话人数据训练而成的理想系统相差较远。此外,说话人自适应对系统声学模型的所有高斯单元进行变换,涉及复杂的矩阵运算,计算复杂度较高。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种基于非线性谱变换的特征补偿方法。在该方法中,用大量说话人的标准语音训练生成一个高斯混合模型(GMM:Gaussian Mixture Model);在测试阶段,用各种变换参数对目标说话人每帧语音的幅度谱进行非线性频率变换,使GMM的输出概率最大,将输出概率最大时的美尔频率倒谱系数(MFCC:Mel Frequency Cepstral Coefficients)作为补偿后的目标语音特征参数。
本发明的具体步骤如下:
(1)从大量说话人的训练语音中提取标准MFCC,训练生成一个高斯混合模型;
(2)对目标说话人的语音加窗,分帧,快速傅里叶变换(FFT:Fast FourierTransform),得到每帧语音信号的幅度谱;
(3)对每帧语音信号的幅度谱进行频率变换;
(4)对变换后的幅度谱进行Mel滤波,取对数,离散余弦变换(DCT:DiscreteCosine Transform),得到非线性频率变换后的MFCC;
(5)用GMM对非线性频率变换后的MFCC进行声学解码,记录输出概率;
(6)更换频率变换参数,重复(3)~(5);
(7)比较每个频率变换参数对应的输出概率,选取输出概率最大的变换参数对应的MFCC作为补偿后的目标语音特征参数。
附图说明
图1为基于非线性谱变换的特征补偿系统的总体框架图,主要包括FFT、频率变换、Mel滤波、取对数、DCT和GMM解码模块。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711112747.6/2.html,转载请声明来源钻瓜专利网。