[发明专利]基于MFCC和改进BP神经网络的声纹识别方法及系统在审
申请号: | 201810963310.1 | 申请日: | 2018-08-22 |
公开(公告)号: | CN108847244A | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 高明柯;王熠;周燕琼;邵培南;夏定江;白利娟;李旭波;崔璨;王灿 | 申请(专利权)人: | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L25/24 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 201800 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征参数 语音信号 改进 声纹识别 迭代 模型训练 随机梯度 特征提取 训练效果 错误率 有效地 声纹 应用 | ||
本发明提供了一种基于MFCC和改进BP神经网络的声纹识别方法及系统,包括:采用MFCC对语音信号进行特征提取,得到MFCC特征参数;将语音信号的MFCC特征参数输入改进BP神经网络中进行模型训练;从待识别语音信号中提取MFCC特征参数,输入训练好的改进BP神经网络中计算,将错误率最低值所对应的计算结果作为最终识别结果。本发明利用MFCC和改进的BP神经网络相结合,能够更有效地识别声纹,以随机梯度下降代替梯度下降,在相同的迭代次数的情况下,所耗费的时间更少,相同的时间内,迭代的次数更多,可以达到更好的训练效果,具有广泛的应用前景。
技术领域
本发明涉及声纹识别领域,具体地,涉及基于MFCC和改进BP神经网络的声纹识别方法及系统。
背景技术
MFCC:梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients),将时域的语音变为频域,对频域的信号进行分段滤波,得出不同频率段的占比,所得到的占比系数组成的矩阵即梅尔倒频谱系数。
BP神经网络:反向传播神经网络(Back Propagation),一种按照误差逆向传播算法训练的多层前馈神经网络。
SGD:随机梯度下降(Stochastic Gradient Descent),一种优化方法,属于梯度下降的一种,适用于大规模的问题。
声纹识别,又称说话人识别,是指通过对声纹语音信号的分析处理,自动识别说话人身份的技术。语音信号是由不同的发音器官随时间而改变位置而产生的一系列声音,鉴于声音的特性与个体的生理解剖结构相关,因此不同人所发出的声音不同,同时可以根据这一点进行说话人身份识别。声纹识别的基本方法是通过不同的语音信号提取声纹的特征,将特征进行训练,并在得到的识别模型中进行推理。
目前常用的声纹识别的主流方法有动态时间规整(DTW)、隐马尔科夫刚理论(HMM)、矢量量化(VQ)等。然而,这些方法都具有识别的准确率较低、需要进行大量的计算、缺乏动态的训练或者过度依赖原话者等缺点。
BP神经网络是一种误差反向传播的多层前馈网络,具有大规模并行处理、分布式信息存储、良好的自组织和自学习能力及原理简单、容易实现等优点。但其也存在固有的缺陷,如容易过拟合,收敛速度慢等。在传统的BP神经网络中使用的梯度下降是一种全局最优解,但在每个迭代步骤中,要求使用所有的训练数据。当样本数量很大时,该方法的迭代速度较低,处理时间越来越长。
发明内容
针对现有技术中的缺陷,本发明的目的是提供基于MFCC和改进BP神经网络的声纹识别方法及系统。
根据本发明提供的一种基于MFCC和改进BP神经网络的声纹识别方法,包括:
语音处理步骤:采用MFCC对语音信号进行特征提取,得到MFCC特征参数;
模型训练步骤:将语音信号的MFCC特征参数输入改进BP神经网络中进行模型训练;
语音识别步骤:从待识别语音信号中提取MFCC特征参数,输入训练好的改进BP神经网络中计算,将错误率最低值所对应的计算结果作为最终识别结果。
较佳的,所述语音处理步骤包括:
预加重子步骤:将语音信号通过滤波器提升高频部分;
分帧子步骤:对预加重后的语音信号进行分帧;
汉明窗子步骤:将分帧后的语音信号的每帧乘以汉明窗;
快速傅里叶变换子步骤:对汉明窗后的每一帧语音信号进行快速傅里叶变换,得到能量谱;
三角带通滤波子步骤:将能量普输入三角带通滤波器组;
对数能量计算子步骤:计算每个三角带通滤波器输出的对数能量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东计算技术研究所(中国电子科技集团公司第三十二研究所),未经华东计算技术研究所(中国电子科技集团公司第三十二研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810963310.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:声纹特征更新方法、装置、存储介质及电子设备
- 下一篇:语音检测方法和装置