[发明专利]复杂背景噪声中的语音激活检测方法有效
申请号: | 201110093186.6 | 申请日: | 2011-04-14 |
公开(公告)号: | CN102194452A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 梁峰;张凡;曹军勤;杨勇 | 申请(专利权)人: | 西安烽火电子科技有限责任公司 |
主分类号: | G10L11/02 | 分类号: | G10L11/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710075 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 背景 噪声 中的 语音 激活 检测 方法 | ||
技术领域
本发明一般涉及数字信号处理系统,更具体地,本发明涉及复杂背景噪声中的语音激活检测(VAD,Voice Activity Detection)方法,尤其面向于计算资源受限的实时语音检测场合,如军用电台语音业务等。
背景技术
语音激活检测技术(VAD)又称端点检测EPD(End-Point Detection),其目的是能够正确区分语音与各种背景噪声,在语音信号处理(更一般的是声信号处理)领域有着十分重要的应用。在语音识别中,通常是先根据一定的端点检测算法,对语音信号中的有声片段和无声片段进行分割,而后再针对有声片段依据语音的某些特定特征进行识别。研究表明:即使在安静的环境中,语音识别系统一半以上的识别错误来自端点检测器。因此,作为语音识别系统的第一步,端点检测的关键性不容忽视,尤其是强背景噪声环境下语音的端点检测,它的准确性很大程度上直接影响着后续的工作能否有效进行。语音和背景噪声的多样性使得VAD问题变得比较复杂。
从实质上来说,各种VAD检测技术的根本出发点在于寻找能够有效区分语音段与无语音噪声背景的统计量,且最终归结为门限判决。目前主要使用的传统统计特征量包括:短时能量、短时过零率、短时自相关函数、信息熵、倒谱及MEL系数等方法,不同VAD技术大多基于这几种方法的不同组合。随着数字信号处理技术的发展和相应处理设备计算能力的提高,出现一些新的VAD算法,如小波变换法、近视熵、支撑向量机SVM以及神经网络等方法。
一般来说,单一的统计判断量的检测效果并不理想,往往仅适合某些特定场合。由于不同环境下的背景噪声变化较大,且语音随者说话人的性别、年龄、语种、声调、声强、语速等变化而变化,因此,基于多统计量、多判决门限的联合判决准则成为VAD检测研究的方向。
在军用电台中,语音信号检测是军用电台完成静噪的前提。静噪是电台的基本功能之一,它保证在有接收信号时,打开接收机的音频输出,保持正常通信;而在无接收信号,只有噪声时,关断音频输出。它的基本过程是首先能够检测到信号的有无,然后再据此控制音频输出。在军用小型便携式电台设备中,受功耗所限,有效地使用VAD技术能够在无语音段降低功耗,延长设备使用时间。
发明内容
由于受到使用设备计算能力及功耗的限制,所采用的VAD算法不能过于复杂,同时处理延迟(主要是语音出现、语音结束的判决延迟)不能过大,即具备近实时处理能力。此外,该方法还应能在复杂背景噪声中正常工作,具备一定自适应性能,这些因素导致VAD算法必须实现简单、检测可靠。基于上述应用要求,本发明给出一种语音激活检测方法。采用如下技术方案:
一种复杂背景噪声中的语音激活检测方法,依次包括以下步骤:
1)、首先对数据进行TEO运算:TEO[x(n)]=x(n)2-x(n+1)x(n-1);
2)、对输入数据x(n)进行预加重,其传递函数为:
H(z)=1-μz-1,μ∈[0.92,0.96],x(n)=filter([1-μ],1,x(n));
3)、带通滤波:采用带通滤波,除去无用信号:x(n)=band_pass_filter(x(n))
4)、分帧加窗处理:帧长20ms,帧间重叠20%~40%。窗函数一般采用Hamming窗:xn(N)=xn(N).*Hamming(N);
5)、计算每帧的自相关及其标准方差的开方值:Stat=k*sqrt(std(xcorr(xn(N)))),k为系数,它与判决门限取值相关;
6)、计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;判断根据:如果初始阶段无语音,则std(Stati)较小,否则std(Stati)较大;如初始阶段无语音,则计算该阶段的参考门限,作为后续数据的判决门限:Thref=mean(Stat(1:20))+m*std(Stat(1:20));
7)、计算后续数据,每帧判决一下:
8)、计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决:或者采用多数判决原则次判断:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火电子科技有限责任公司,未经西安烽火电子科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110093186.6/2.html,转载请声明来源钻瓜专利网。