[发明专利]MFCC语音识别方法、存储介质、电子设备及系统在审
申请号: | 201710731077.X | 申请日: | 2017-08-23 |
公开(公告)号: | CN107527611A | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 李振华;陈少杰;张文明 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/02;G10L25/24;G10L25/21 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙)42225 | 代理人: | 沈林华 |
地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | mfcc 语音 识别 方法 存储 介质 电子设备 系统 | ||
技术领域
本发明涉及语音识别领域,具体涉及一种MFCC(Mel-Frequency Cepstral Coefficients,梅尔频率倒谱系数)语音识别方法、存储介质、电子设备及系统。
背景技术
MFCC是一种在自动语音和说话人识别中广泛使用的特征,由于MFCC特征参数是语音信号中最具有辨识度的特征,因此MFCC特征参数已经广泛应用于语音设别领域中,即在语音设别时,提取到语音信号中的MFCC特征参数,就基本完成了语音识别功能。
但是,对于噪音较多的语音信号、以及语音信号的高频区域而言,MFCC特征参数的识别精度较低,进而使得MFCC特征参数难以提取。
发明内容
针对现有技术中存在的缺陷,本发明解决的技术问题为:如何在噪声环境和高频区域的语音信号中识别MFCC特征参数,本发明能够大幅度提高MFCC特征参数的识别精度,非常适于推广。
为达到以上目的,本发明提供的MFCC语音识别方法,包括以下步骤:
S1:对需要语音识别的语音信号进行预处理,得到MFCC初始信号,转到S2;
S2:根据MFCC初始信号的低频频域信号f1,计算MFCC初始信号的低频频率fl,计算公式为:
根据MFCC初始信号的中频频域信号f2,计算MFCC初始信号的中频频率fm,计算公式为:
根据MFCC初始信号的高频频域信号f3,计算MFCC初始信号的高频频率fh,计算公式为:转到S3;
S3:将MFCC初始信号的低频频率fl、中频频率fm和高频频率fh进行融合,得到MFCC特征参数F,计算公式为:
其中N代表语音信号进行FFT变换时的点数,Fs代表阻带截止频率,Fs为常量,Q-1代表fm的反函数,Q(fl)代表将fl作为f2后根据fm的计算公式计算fm,Q(fh)代表将fh作为f2后根据fm的计算公式计算fm,H代表语音设别中需要使用的滤波器的个数。
在上述技术方案的基础上,S3之后还包括以下步骤:S4:对MFCC特征参数F进行降维,得到MFCC降维特征参数F降,计算公式为:σbetween为类间离散度,表示语音信号的第k维MFCC特征参数的类间方差的和;σwithin为类内离散度,表示语音信号的第k维MFCC特征参数的类内方差的和。
本发明提供的存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述MFCC语音识别方法。
本发明提供的电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,处理器执行计算机程序时实现上述MFCC语音识别方法。
本发明提供的MFCC语音识别系统,包括语音信号预处理模块、MFCC初始信号频率计算模块和MFCC特征参数融合模块;
语音信号预处理模块用于:对需要语音识别的语音信号进行预处理,得到MFCC初始信号,向MFCC初始信号频率计算模块发送MFCC初始信号频率计算信号;
MFCC初始信号频率计算模块用于:收到MFCC初始信号频率计算信号后,根据MFCC初始信号的低频频域信号f1,计算MFCC初始信号的低频频率fl,计算公式为:
根据MFCC初始信号的中频频域信号f2,计算MFCC初始信号的中频频率fm,计算公式为:
根据MFCC初始信号的高频频域信号f3,计算MFCC初始信号的高频频率fh,计算公式为:向MFCC特征参数融合模块发送MFCC特征参数融合信号;
MFCC特征参数融合模块用于:收到MFCC特征参数融合信号后,将MFCC初始信号的低频频率fl、中频频率fm和高频频率fh进行融合,得到MFCC特征参数F,计算公式为:
其中N代表语音信号进行FFT变换时的点数,Fs代表阻带截止频率,Fs为常量,Q-1代表fm的反函数,Q(fl)代表将fl作为f2后根据fm的计算公式计算fm,Q(fh)代表将fh作为f2后根据fm的计算公式计算fm,H代表语音设别中需要使用的滤波器的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710731077.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多面阵相机采集存储传输系统
- 下一篇:一种柔性线路板检测装置