[发明专利]一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法有效
申请号: | 201811359541.8 | 申请日: | 2018-11-15 |
公开(公告)号: | CN109256127B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 葛洪伟;李聪;陈国俊 | 申请(专利权)人: | 江南大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/24;G10L15/20;G10L19/26;G10L21/0208;G10L25/27 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法,主要解决针对在噪声环境下语音识别系统性能急剧下降的问题,该方法通利用符合耳蜗听觉特性的Gammachirp滤波器组,并对该滤波器进行了压缩归一化的处理优化,在得到响应系数后,通过一个分段式非线性的幂函数变换过程,使其能够模拟人耳听觉模型处理信号的非线性特性。并且,方法中结合了相对谱RASTA滤波、均值方差归一化和时间序列滤波等技术方法,进一步提高了语音特征的抗噪鲁棒性。本发明方法能够提高噪声环境下语音识别系统的识别率,提高系统的抗噪鲁棒性,满足日常生活中如智能家居、车载系统和各种需要进行身份安全认证的安全领域。 | ||
搜索关键词: | 一种 基于 非线性 变换 gammachirp 滤波器 语音 特征 提取 方法 | ||
【主权项】:
1.一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法,其特征在于,如下步骤:(1)语音信号预处理:对输入的语音信号x(n)进行预加重处理:y(n)=x(n)‑μ·x(n‑1),其中,μ为预加重系数,y(n)是预加重处理后的语音信号,n为语音信号的个数;(2)对预加重后的语音信号进行RASTA滤波处理,得到滤波后的信号y′(n):y′(n)=Rasta(y(n));(3)语音信号的分帧、加窗:将滤波后的信号分为短时的语音帧,对短时的语音帧进行加窗处理,得到加窗后的语音信号S(n);(4)短时傅里叶变换:对加窗后的时域语音帧片段进行短时傅里叶变换,将其由时域变换到频域,得到每一帧语音信号的短时傅里叶变换后的幅度谱Y(t,i),变换公式为:Y(t,i)=fft(S(n),iFFT),其中,t表示语音信号的帧数;i表示频率分量数;傅里叶变换长度iFFT=512;(5)归一化压缩Gammachirp滤波器滤波,得到语音信号在不同频率分量上的响应幅值Gm(t,k),其中,k表示滤波器的阶数;(6)分段非线性幂函数变换,根据频率值确定幂函数变换系数α,根据公式进行变换,得出幂函数变换后的响应幅值:Gc(t,k)=Gmα(t,k);其中,Gc(t,k)代表第t帧语音在第k阶滤波器上的响应幅值;(7)离散余弦变换,即DCT变换:将每一帧语音在Gammachirp滤波器组的响应输出进行离散余弦变换,去除其参数间的相关性,得到变换后的倒谱系数GDct,DCT变换的过程:
其中DCT(k,m)表示N维离散余弦变换矩阵中第k行m列的值,它的定义是:
GDct(t,k)代表经过DCT变换后第t帧语音在第k阶滤波器上的响应幅值;(8)差分倒谱系数:差分倒谱系数是通过步骤(7)得到的GDct(t,k)经过相邻前后各两帧的运算得到:GDct′(t)=(2×GDct(t‑2)‑GDct(t‑1)+GDct(t+1)+2×GDct(t+2))/10,其中,GDct′(t)代表第t帧向量的差分系数,取DCT变换后原倒谱系数的前16维和差分后的前16维系数,共同组成32维的倒谱系数G;(9)倒谱均值、方差的归一化:倒谱均值归一化过程是:
倒谱方差归一化过程是:
其中μG表示倒谱特征均值,δG表示倒谱方差,T为帧长;(10)时间序列滤波:对得到的语音特征采用一种平滑滤波的方式来减小基音频率,利用滑动滤波器对得到的语音特征进行滤波,得出消除基音频率影响后的NPGFCC语音特征
其中W是窗口长度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811359541.8/,转载请声明来源钻瓜专利网。