[发明专利]基于时域和频域的语音活性检测方法和设备有效
申请号: | 201410641920.1 | 申请日: | 2014-11-13 |
公开(公告)号: | CN104464722B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 关海欣 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 南毅宁;桑传标 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于时域和频域的语音活性检测方法和设备。该方法包括:估计语音信号的噪声能量;向输入的语音信号中加入白噪声;对加入白噪声后的语音信号进行分帧处理;确定每帧的短时能量值;确定每帧的谐波乘积谱值;以及针对每一帧,根据该帧的短时能量值和该帧的谐波乘积谱值来确定该帧是否为语音帧,并得出所述语音信号中所包含的语音片段。本发明提供的语音活性检测方法和设备,结合了时域分析与频域分析方法,针对实际情况具有更好的适应性,在背景噪声为人声以及信噪比较低等情况下也有很好的表现,并且该方法实现简单、精巧,很容易嵌入各类语音系统中。 | ||
搜索关键词: | 方法和设备 活性检测 语音信号 短时能量 语音 白噪声 和频 时域 谐波 背景噪声 频域分析 时域分析 语音片段 语音系统 噪声能量 语音帧 分帧 嵌入 表现 | ||
【主权项】:
1.一种基于时域和频域的语音活性检测方法,其特征在于,该方法包括:在向输入的语音信号中加入白噪声之前,估计所述语音信号的噪声能量;根据所估计的噪声能量确定要加入的白噪声的比例;按照所确定的比例向所述输入的语音信号中加入白噪声;对加入白噪声后的语音信号进行分帧处理;确定每帧的短时能量值,所述短时能量反映所述语音信号的时域特性;确定每帧的谐波乘积谱值;以及针对每一帧,根据该帧的短时能量值和该帧的谐波乘积谱值来共同确定该帧是否为语音帧,并得出所述语音信号中所包含的语音片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410641920.1/,转载请声明来源钻瓜专利网。