[发明专利]一种基于误差逆向传播神经网络的声纹识别方法在审
申请号: | 202010321963.7 | 申请日: | 2020-04-22 |
公开(公告)号: | CN111524520A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 宋永端;陈里蒙 | 申请(专利权)人: | 星际(重庆)智能装备技术研究院有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/18;G10L17/22;G10L25/24;G10L25/30;G10L25/45;G10L15/05;G10L15/16 |
代理公司: | 重庆信航知识产权代理有限公司 50218 | 代理人: | 吴彬 |
地址: | 400030 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 误差 逆向 传播 神经网络 声纹 识别 方法 | ||
1.一种基于误差逆向传播神经网络的声纹识别方法,其特征在于:包括如下步骤:
步骤1:采集已知说话人的语音信号,得到语音频谱图后对语音信号进行预处理,所述语音信号的预处理包括采样和量化、预加重、分帧加窗和端点检测;
所述语音信号的预加重包括:
将经过采样与量化转换后的数字语音信号输入一阶高通滤波器,凸显语音信号的高频部分,所述一阶高通滤波器的传递函数为:
H(Z)=1-0.975Z-1
其中,Z为语音信号的频率;
所述语音信号的分帧加窗包括:
将连续语音信号拆分为多帧语音信号;
采用多正弦窗作为窗函数对已分帧信号进行加窗处理,所述多正弦窗为:
其中,N为语音信号的帧数,n=1,2,...,N,j表示窗的个数;
所述语音信号的端点检测包括:
采用短时能量方法和短时过零率方法将语音信号中的清浊音分开.
步骤2:采用美尔频率倒谱系数作为语音信号的特征参数,对预处理后的语音信号进行美尔频率倒谱系数提取,其包括如下步骤:
S1:将经过预处理的语音信号进行短时傅里叶变换,变换为频域,取模的平方得到离散功率谱:
其中,N为采样点数,j表示窗的个数;
S2:将线性频率f映射到美尔频率fmel上,
S3:通过美尔尺度滤波器组得到美尔功率频谱,
滤波器的频率响应为:
其中,f(m)为在Mel频率轴上的中心频率,M表示滤波器个数,
S4:通过对美尔功率频谱取对数的信号进行离散余弦变换获得美尔频率倒谱系数,
其中M为滤波器个数,L为美尔频率倒谱系数的阶数;
步骤3:建立BP神经网络,用步骤1所提取的美尔频率倒谱系数中的一部分训练BP神经网络;
步骤4:采集待识别语音信号,根据步骤1的方法获得待识别语音信号的美尔频率倒谱系数,并将其输入步骤2训练好的BP神经网络进行识别,得出识别结果。
2.根据权利要求1所述的基于误差逆向传播神经网络的声纹识别方法,其特征在于:所述步骤3中的BP神经网络,其权重变化算法为:
Δw()为权重变化,η为学习率,为α动量因子。
所述步骤1和4中还包括对采集到的待识别语音信号增加噪声进行数据增强,公式如下:
其中,SNR为信噪比,Psignal为信号功率,Pnoise为噪声功率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星际(重庆)智能装备技术研究院有限公司,未经星际(重庆)智能装备技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010321963.7/1.html,转载请声明来源钻瓜专利网。