[发明专利]基于时域和频域的语音活性检测方法和设备有效
申请号: | 201410641920.1 | 申请日: | 2014-11-13 |
公开(公告)号: | CN104464722B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 关海欣 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 南毅宁;桑传标 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法和设备 活性检测 语音信号 短时能量 语音 白噪声 和频 时域 谐波 背景噪声 频域分析 时域分析 语音片段 语音系统 噪声能量 语音帧 分帧 嵌入 表现 | ||
本发明公开了一种基于时域和频域的语音活性检测方法和设备。该方法包括:估计语音信号的噪声能量;向输入的语音信号中加入白噪声;对加入白噪声后的语音信号进行分帧处理;确定每帧的短时能量值;确定每帧的谐波乘积谱值;以及针对每一帧,根据该帧的短时能量值和该帧的谐波乘积谱值来确定该帧是否为语音帧,并得出所述语音信号中所包含的语音片段。本发明提供的语音活性检测方法和设备,结合了时域分析与频域分析方法,针对实际情况具有更好的适应性,在背景噪声为人声以及信噪比较低等情况下也有很好的表现,并且该方法实现简单、精巧,很容易嵌入各类语音系统中。
技术领域
本发明涉及语音活性检测领域,具体地,涉及一种基于时域和频域的语音活性检测方法和设备。
背景技术
语音活性检测(Voice Activity Detection,VAD)是一种用于检测语音信号是否存在的语音处理技术。语音活性检测技术主要用于语音识别、语音编码等,其能够区别出静音、语音片段,为后续针对语音信号的进一步处理作铺垫。语音活性检测模块也是很多语音通信系统中不可或缺的部分,如音频会议、语音识别、回声消除、IP电话等。针对语音识别系统来说,语音活性检测模块的准确度会极大影响到后续的特征提取、模型建立及判决等工作,因此,提供高效、鲁棒性高的语音活性检测显得尤为重要。
现有的语音活性检测技术有很多种,如基于短时能量、短时过零率的时域分析方法,也有基于倒谱频率、线性预测编码(LPC)系数等的频域分析方法。这些方法各有优势,各自利用不同的特性来区分语音与噪声。然而,在实际使用中,经常出现较低信噪比、背景噪声也为人声等等情况,此时使用传统的方法难以得到足够准确的结果。
发明内容
本发明的目的是提供一种能够提高语音活性检测结果的准确度(特别是在信噪比较低、或者背景噪声为人声的情况下)的基于时域和频域的语音活性检测方法和设备。
为了实现上述目的,本发明提供一种基于时域和频域的语音活性检测方法。该方法包括:向输入的语音信号中加入白噪声;对加入白噪声后的语音信号进行分帧处理;确定每帧的短时能量值;确定每帧的谐波乘积谱值;以及针对每一帧,根据该帧的短时能量值和该帧的谐波乘积谱值来确定该帧是否为语音帧,并得出所述语音信号中所包含的语音片段。
优选地,该方法还包括:在向所述输入的语音信号中加入所述白噪声之前,估计所述语音信号的噪声能量;以及根据所估计的噪声能量来确定要加入的白躁声的比例;以及向所述输入的语音信号中加入所述白噪声是按照所确定的比例进行的。
优选地,对所述语音信号的噪声能量的所述估计是动态进行的。
优选地,所述白噪声为高斯白噪声。
优选地,确定所述每帧的谐波乘积谱值的步骤包括:对所述加入白噪声后的语音信号进行规范化;获取每帧的频域信息;以及根据所述每帧的频域信息来确定所述每帧的谐波乘积谱值。
优选地,通过以下方式来确定所述帧是否为语音帧:在所述帧的短时能量值大于或等于第一阈值、并且所述帧的谐波乘积谱值大于或等于第二阈值的情况下,确定所述帧为所述语音帧。
优选地,通过以下方式来确定所述帧是否为语音帧:利用预先建立的分类模型、根据所述帧的短时能量值和所述帧的谐波乘积谱值来对所述帧进行分类,以确定所述帧是否为所述语音帧。
本发明还提供一种基于时域和频域的语音活性检测设备。该设备包括:用于向输入的语音信号中加入白噪声的装置;用于对加入白噪声后的语音信号进行分帧处理的装置;用于确定每帧的短时能量值的装置;用于确定每帧的谐波乘积谱值的装置;以及用于针对每一帧,根据该帧的短时能量值和该帧的谐波乘积谱值来确定该帧是否为语音帧,并得出所述语音信号中所包含的语音片段的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410641920.1/2.html,转载请声明来源钻瓜专利网。