[发明专利]一种基于分数阶小波变换的CFCC特征提取方法在审
申请号: | 202211107486.X | 申请日: | 2022-09-13 |
公开(公告)号: | CN115512710A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 龙华;黄张衡;邵玉斌;杜庆治;苏树盟;王延凯;段云 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/26;G10L25/03;G10L25/27;G10L25/45 |
代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 王鹏飞 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分数 阶小波 变换 cfcc 特征 提取 方法 | ||
1.一种基于分数阶小波变换的CFCC特征提取方法,其特征在于:
Step1:获取语音信号对其进行预处理,所述预处理包括预加重、分帧、加窗;
Step2:采用新型分数阶小波变换来构建耳蜗滤波器,然后将预处理后的语音信号通过耳蜗滤波器模拟语音信号在人耳基底膜上的传播过程;
Step3:将从耳蜗滤波器输出的语音信号通过毛细胞函数,通过毛细胞函数把声音振动能量转变为生物电能最终再转化为大脑能够分析的电信号;
Step4:将通过毛细胞函数转换后的电信号利用非线性幂函数响度变换对其进行压缩处理,使其由能量值转变为感知响度特征;
Step5:将经过非线性压缩后的感知响度特征进行离散余弦变换进行去相关处理,去相关后的输出特征为:
其中,0≤r≤R,0≤n≤N,R为滤波器个数,n为特征变换后每帧的维数;
Step6:最后再将DCT变换后的特征采用升半弦倒谱提升来降低特征中频率声波的低维分量提升高维分量的作用,从而得到新型耳蜗倒谱系数NFCFCC。
2.根据权利要求1所述的基于分数阶小波变换的CFCC特征提取方法,其特征在于,所述Step1中的预处理具体为:对输入的语音信号作预加重处理后再进行分帧处理,每一帧为32ms,帧长设置为16ms,最后作加窗处理,此处加的汉明窗。
3.根据权利要求1所述的基于分数阶小波变换的CFCC特征提取方法,其特征在于,所述Step2具体为:
Step2.1:由于预处理以后的语音信号需要通过耳蜗滤波器进行信号滤波,且构建耳蜗滤波器组需要采用分数阶小波变换构建。因此在分数阶小波变换母小波中引入一个能够随着声音强度变化而变化的啁啾参数η:
其中,t为时间,a为尺度因子,由耳蜗滤波器组的中心频率fC与最低中心频率fL比值决定,即a=fC/fL,b为位移因子,μ为啁啾因子;
Step2.2:将啁啾参数η引入到能够模拟人耳基底膜的分数阶母小波ζp,a,b(t)中构成新型分数阶小波变换:
其中,θ为控制冲激响应角度的初始相位、u(t)为单位阶跃函数
Step2.3:采用新型分数阶小波变换来构建耳蜗滤波器,将预处理后的语音信号通过构建好的耳蜗滤波器模拟语音信号在人耳基底膜上的传播过程;
信号通过耳蜗滤波器正变换后的输出为Y(p,a,b),如式(4)所示:
4.根据权利要求1所述的基于分数阶小波变换的CFCC特征提取方法,其特征在于,所述Step3具体为:
得到从耳蜗滤波器输出的语音信号后,将其通过毛细胞函数来将声波物理振动能量转换为生物电能,最后再转换为人的大脑可以进行分析的电信号:
k(a,b)=[Y(p,a,b)]2 (5)
其中,滤波器的中心频率响应的神经穗就表示为H(i,j),如式(6)所示:
其中,帧移L=d/2,j为窗的个数,d为可变窗长,如式(7)所示:
di=max{3.5τi,20ms} (7)
其中,τi为第i个滤波器中心频带中心频率的时间长度。
5.根据权利要求1所述的基于分数阶小波变换的CFCC特征提取方法,其特征在于,所述Step6具体为:
将进行去相关处理后的特征采用升半正弦倒谱窗函数V(i)来降低特征频率声波中的低维分量而提升高维分量的作用,具体为:
最后,得到新型耳蜗倒谱系数NFCFCC:
NFCFCCi=F(i)×V(i) (9)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211107486.X/1.html,转载请声明来源钻瓜专利网。