[发明专利]一种声纹识别的特征参数提取系统及方法在审
申请号: | 202010323463.7 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111816186A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 韩成;张超;杨帆;李岩芳;胡汉平;杨华民;蒋振刚;李华;权巍;耿雪娜;徐春风 | 申请(专利权)人: | 长春理工大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L25/18;G10L25/45 |
代理公司: | 合肥顺超知识产权代理事务所(特殊普通合伙) 34120 | 代理人: | 陈慕;张芳 |
地址: | 130000 *** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 特征 参数 提取 系统 方法 | ||
1.一种声纹识别的特征参数提取系统,其特征在于:该系统包括有同步控制器1、麦克风阵列2和计算机3,所述同步控制器1通过电缆与计算机3进行连接,所述麦克风阵列2通过电缆与计算机3进行连接。
2.根据权利要求1所述的一种声纹识别的特征参数提取系统,其特征在于:所述同步控制器1的型号为百灵达BCD3000。
3.一种声纹识别的特征参数提取方法,其特征在于,包含以下步骤:
S1、利用同步控制器同时控制A个麦克风构成的麦克风阵列进行多路信号的采集,得到A个声纹信号,分别为声纹信号V1,V2…,VA;
S2、针对声纹信号Vn,其中1≤n≤A,其经过采样后的声纹信号在第t个采样点时刻的信号为Vn(t),为了提升采样信号的数据的有效性,根据公式:Vn‘(t)=Vn(t)-0.96*Vn(t-1)t≥2;
Vn‘(t)=Vn(t) t=1;
对声纹信号进行预处理,得到处理后的声纹信号用Vn‘(t)表示;
S3、由于采集到的声纹信号是非平稳分布,但是声纹信号其在短时间p内,其语音特征信息具有平稳性,语音信号的大小L一般远高于短时间p,以短时间p的语音段对采集的语音信号进行分段处理,得到m=L/P个语音帧,称这m个语音帧为分析处理帧,为了防止吉布斯效应以及保持语音信号处理的连续性,需保持各个分析处理帧之间具有重叠部分,其中重叠部分一般取值为短时间p的1/2或者1/3,定义下式的窗口函数win(t)对语音信号进行平滑的移动处理,其中N表示窗口的长度,对预加重处理后的信号Vn‘(t)进行加窗处理以后得到Vn‘’(t)=Vn‘(t)*win(t),其中:
S4、A个声纹信号进行加窗处理以后进行线性叠加处理,也即是对第n个采样声纹信号进行Vn”’(t)=(Vn”(t))2/SUM;其中SUM=(V1”(t))2+(V2”(t))2+…(VA’(t))2,再对处理的声纹信号Vn”’(t)进行叠加处理,也即是F(t)=b1*V1”’(t)+b2*V2”’(t)+···bA*VA”’(t);
S5、对声纹信号线性叠加后的时域信号F(t)利用公式:
进行快速傅立叶变换,得到语音信号的频谱Y(k);
S6、对语音信号频谱Y(k)进行频谱转换到Mel域上的频谱,也即是利用Mel滤波器对其进行转换处理,设Mel滤波器具有M个三角带通滤波器,其对应的中心频率为h(m),m=1,2,…M,其值为:h(m)=(N/S)*Q-1(Q(hl)+m*((Q(hh)-Q(hl))/(M+1)));而Q-1(x)=700*(e(x-1125)-1),其中S为采样频率,Q(hl)和Q(hh)分别为Mel滤波器组内的最低频率和最高频率,通过中心频率为h(m),定义每个M个三角带通滤波器的传递函数FBm(k),当h(m)k=h(m+1)时,FBm(k)=(h(m+1)-k)/(h(m+1)-h(m));当h(m-1)=k=h(m)时,FBm(k)=(k-h(m-1))/(h(m)-h(m-1));当h(m-1)k或者kh(m-1)时,FBm(k)=0;
S7、为了减少噪声以及频率谱估计误差造成的干扰,对Mel频率谱进行对数能量处理,也即是用进行处理;
S8、通过对Mel频率谱中的对数能量S(m)进行离散余弦变换,其中采用对其进行变换,得到的Mel频率谱系数,可以使得得到的语音特征向量之间具有独立性,同时也能够减少语音特征参数的维度,使得识别正确率得到提高;
S9、对Mel频率谱系数进行J阶差分处理,也即是当iJ时,gi=D(i+1)-D(i);当i=T-J时,gi=D(i)-D(i)+1;当iJ或者iT-J时,其中α的取值为1≤α≤J,T表示倒谱系数维数,通过对Mel频率谱系数进行J阶差分处理以后即可得到语音特征信息参数。
4.根据权利要求3所述的一种声纹识别的特征参数提取方法,其特征在于;S1中,为了保持采集的信号的完整性,采样频率取大于语音信号的最高频率的两倍,本发明采用逐帧采样等间隔抽样方式,其中采样频率为8kHz,量化幅度为8bit。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010323463.7/1.html,转载请声明来源钻瓜专利网。