[发明专利]复杂背景噪声中的语音激活检测方法有效
申请号: | 201110093186.6 | 申请日: | 2011-04-14 |
公开(公告)号: | CN102194452A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 梁峰;张凡;曹军勤;杨勇 | 申请(专利权)人: | 西安烽火电子科技有限责任公司 |
主分类号: | G10L11/02 | 分类号: | G10L11/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710075 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 背景 噪声 中的 语音 激活 检测 方法 | ||
1.一种复杂背景噪声中的语音激活检测方法,其特征在于,依次包括以下步骤:
1)、首先对数据进行TEO运算:TEO[x(n)]=x(n)2-x(n+1)x(n-1);
2)、对输入数据x(n)进行预加重,其传递函数为:
H(z)=1-μz-1,μ∈[0.92,0.96],x(n)=filter([1-μ],1,x(n));
3)、带通滤波:采用带通滤波,除去无用信号:x(n)=band_pass_filter(x(n))
4)、分帧加窗处理:帧长20ms,帧间重叠20%~40%。窗函数一般采用Hamming窗:xn(N)=xn(N).*Hamming(N);
5)、计算每帧的自相关及其标准方差的开方值:Stat=k*sqrt(std(xcorr(xn(N)))),k为系数,它与判决门限取值相关;
6)、计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;判断根据:如果初始阶段无语音,则std(Stati)较小,否则std(Stati)较大;如初始阶段无语音,则计算该阶段的参考门限,作为后续数据的判决门限:Thref=mean(Stat(1:20))+m*std(Stat(1:20));
7)、计算后续数据,每帧判决一下:
8)、计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决:或者采用多数判决原则次判断:
如8帧中超过5帧出现Statustemp=1,则判断Status=1,出现语音;
9)、考虑语音间隔及持续时间Speechmin=100~200ms,Silencemin=500~1000ms,在Statusfinal=0条件下,当出现连续NS(该值与FrameN相关)个Status=1时,判断语音出现;在Statusfinal=1条件下,当出现连续NE(该值同样与FrameN相关)个Status=0时,判断语音结束,最终判断语音的真正端点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火电子科技有限责任公司,未经西安烽火电子科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110093186.6/1.html,转载请声明来源钻瓜专利网。