[发明专利]基于核主成分分析改进Mel滤波器的语音特征提取方法有效
申请号: | 201710100827.3 | 申请日: | 2017-02-23 |
公开(公告)号: | CN106898362B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 张毅;倪雷 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/24;G10L15/02;G10L15/20 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;李金蓉 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成分 分析 改进 mel 滤波器 语音 特征 提取 方法 | ||
1.基于核主成分分析改进Mel滤波器的语音特征提取方法,包括以下步骤:
S1对初始输入语音信号进行数字化采样、预加重和分帧加窗,得到预处理语音信号;
S2根据伽马通滤波器计算预处理语音信号的伽马通滤波倒谱系数;
S3对伽马通滤波倒谱系数进行滑动差分处理;
S4根据自相关函数对预处理语音信号进行基音频率提取;
S5根据融合公式对伽马通滤波倒谱系数、滑动差分和基音频率进行特征数据融合;所述特征数据融合为:
其中,LGFCC为伽马通滤波倒谱系数及其滑动差分,Fpitch为被测信号的基音频率,S表示数据融合值,Lmax表示最大似然度之差,α表示权重调节系数,k1、k2均表示拉普普拉斯平滑系数,Fmax表示归一化基音频率参数;
S6根据核主成分分析对特征数据融合后的语音特征进行降维处理。
2.根据权利要求1所述基于核主成分分析改进Mel滤波器的语音特征提取方法,其特征在于:所述预加重的传递函数为:
H(z)=1-a*z-1
其中,a表示预加重的系数,H(z)表示传递函数,z表示函数变量。
3.根据权利要求1所述基于核主成分分析改进Mel滤波器的语音特征提取方法,其特征在于:所述分帧加窗处理中采用的加窗函数为:
w(n)表示窗函数,L表示窗函数的长度。
4.根据权利要求1所述基于核主成分分析改进Mel滤波器的语音特征提取方法,其特征在于:所述伽马通滤波倒谱系数通过对伽马通滤波系数取对数和离散余弦变换处理得到;其中离散余弦变换的计算公式为:
X(k)表示离散余弦变换归一函数,x(n)表示一维语音信号序列,N表示信号序列范围值。
5.根据权利要求1或4所述基于核主成分分析改进Mel滤波器的语音特征提取方法,其特征在于:所述伽马通滤波器的时域脉冲响应为:
其中:A为输出增益,M为滤波器阶数,fc是中心频率,是相位,ERB(fc)为等效矩形带宽,t为时间。
6.根据权利要求1所述基于核主成分分析改进Mel滤波器的语音特征提取方法,其特征在于:所述滑动差分处理如下:
ΔC(t)=C(t+d)-C(t-d)=[Δc0(t),Δc1(t),···,ΔcN-1(t)]
ΔC(t+p)=C(t+p+d)-C(t+p-d)
ΔC[t+(k-1)p]=C[t+(k-1)p+d]-C[t+(k-1)p-d]
将t时刻,t+p时刻一直到t+(k-1)p时刻的一阶差分倒谱系数顺序相连,即为当前帧的滑动差分特征向量:
ΔGFCC(t)=[ΔC(t),ΔC(t+p),···,ΔC(t+(k-1)p)]
上式中ΔC(t)表示第t帧语音的一阶差分倒谱系数;ΔcN-1(t)表示第t帧语音的第N-1个倒谱系数;C(t+d)表示第t+d帧语音的GFCC系数;C(t-d)表示第t-d帧语音的GFCC系数;ΔC(t+p)表示第t+p帧语音的一阶差分倒谱系数;C(t+p+d)表示第t+p+d帧语音的GFCC系数;C(t+p-d)表示第t+p-d帧语音的GFCC系数;ΔC[t+(k-1)p]表示第t+(k-1)p帧语音的一阶差分倒谱系数;C[t+(k-1)p+d]表示第t+(k-1)p+d帧语音的GFCC系数;C[t+(k-1)p-d]表示第t+(k-1)p-d帧语音的GFCC系数。
7.根据权利要求1所述基于核主成分分析改进Mel滤波器的语音特征提取方法,其特征在于:所述自相关函数为:
其中,Sn(m)为加窗后的语音信号,Rn(k)表示自相关函数值,k表示时间的延迟量,K表示语音分帧后每帧的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710100827.3/1.html,转载请声明来源钻瓜专利网。