[发明专利]异常声音检测方法及系统有效
申请号: | 201410765322.5 | 申请日: | 2014-12-11 |
公开(公告)号: | CN104538041B | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 杨闯;周蕾蕾 | 申请(专利权)人: | 深圳市智美达科技有限公司 |
主分类号: | G10L25/21 | 分类号: | G10L25/21;G10L25/51 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 邓云鹏 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 短时能量 等级帧 异常声音 频域变换 时域特征 实时采集 实时处理 特征参数 音频信号 音频信息 复杂度 检测 采集 分析 | ||
1.一种异常声音检测方法,包括步骤:
实时采集音频信号;
计算采集的音频信号的每一帧的短时能量和/或过零率;
获取第一短时能量阈值;
依次比较所述音频信号的每一帧的短时能量与所述第一短时能量阈值的大小;
若当前帧的短时能量大于第一短时能量阈值,则将所述当前帧记为第一等级帧;
若当前帧的短时能量小于第一短时能量阈值,则获取第二短时能量阈值和/或过零率阈值,根据第二短时能量阈值或过零率阈值确认是否将所述前帧记为第二等级帧,所述确认是否将所述前帧记为第二等级帧的步骤包括:
若当前帧的短时能量大于所述第二短时能量阈值或当前帧的过零率大于所述过零率阈值,则将所述当前帧记为第二等级帧;
计录连续为第一等级帧或第二等级帧的帧数量;
若比较当前帧的短时能量小于第二短时能量阈值或若当前帧的过零率小于所述过零率阈值,则将所记录的连续为第一等级帧或第二等级帧的帧数量初始化为0;
判断连续为第一等级帧或第二等级帧的帧数量是否大于N且当前帧是否为第一等级帧,其中,N为预定数量,N为正整数;
若是,则判断声音异常;
在所述获取第一短时能量阈值的步骤之前还包括:
自学习音频阈值,计算并保存第一短时能量阈值、第二短时能量阈值和过零率阈值;
所述自学习音频的步骤,具体包括:
采集用于自学习的音频信号;
计算所采集的音频信号的每一帧的短时能量和过零率;
使用直方图分别统计所述音频信号的短时能量和过零率;
判断本次自学习时间是否大于预定的学习时间;
若判断本次自学习时间大于预定的学习时间,则根据直方图计算本次学习正常声音的短时能量和过零率,所述正常声音的短时能量为短时能量直方图中数值最大的组对应的取值范围的中值;所述正常声音过零率为过零率直方图中数值最大的组对应的取值范围的中值;
判断本次学习是否为初次学习;
若判断本次学习为初次学习,根据所述正常声音的短时能量和所述正常声音的过零率计算第一短时能量阈值、第二短时能量阈值和过零率阈值。
2.根据权利要求1所述的异常声音检测方法,其特征在于,所述根据正常声音的短时能量和所述正常常声音的过零率计算第一短时能量阈值STEth1、第二短时能量阈值STEth2和过零率阈值ZCRth的公式分别为:
STEth1=a*STEback
STEth2=0.5*STEth1
ZCRth=b*ZCRback
其中,STEback和ZCRback是本次学习的正常声音的短时能量和过零率,a和b是一个常量参数。
3.根据权利要求2所述的异常声音检测方法,其特征在于,若判断本次学习为非初次学习,则根据上次学习得到的正常声音的短时能量和过零率与本次学习得到的正常声音的短时能量和过零率得到更新的正常声音的短时能量和过零率,并根据更新的正常声音的短时能量和过零率更新第一短时能量阈值、第二短时能量阈值和过零率阈值。
4.根据权利要求3所述的异常声音检测方法,其特征在于,若判断本次学习为非初次学习,则根据上次学习得到的正常声音的短时能量和过零率与本次学习得到的正常声音的短时能量和过零率得到更新的正常声音的短时能量STEback和过零率ZCRback的公式为:
STEback=(1-α)*STEback_last+α*STEback_cur;
ZCRback=(1-α)*ZCRback_last+α*ZCRback_cur;
其中,STEback_last为上次学习的正常声音短时能量;STEback_cur为本次学习的正常声音的短时能量;α为阈值更新速度;ZCRback_last为上次学习的正常声音过零率;ZCRback_cur为本次学习正常声音的过零率。
5.一种异常声音检测系统,其特征在于,包括:
采集模块,用于实时采集音频信号;
计算模块,用于计算采集的音频信号的每一帧的短时能量和/或过零率;
获取模块,获取第一短时能量阈值;
第一比较模块,用于依次比较所述音频信号的每一帧的短时能量与所述第一短时能量阈值的大小;
标记模块,用于当第一比较模块比较当前帧的短时能量大于第一短时能量阈值时,将所述当前帧记为第一等级帧;
所述获取模块,还用于当第一比较模块比较当前帧的短时能量小于第一短时能量阈值时,获取第二短时能量阈值和/或获取过零率阈值;
第二比较模块,用于根据第二短时能量阈值或过零率阈值确认是否将所述前帧记为第二等级帧,具体用于比较当前帧的短时能量与第二短时能量阈值的大小或当前帧的过零率与所述过零率阈值的大小;
所述标记模块,还用于当第二比较模块比较当前帧的短时能量大于所述第二短时能量阈值时或若当前帧的过零率大于所述过零率阈值,将所述当前帧记为第二等级帧;
记录模块,用于计录连续为第一等级帧或第二等级帧的帧数量;
所述记录模块,还用于,在第二比较模块比较当前帧的短时能量小于所述第二短时能量阈值或当前帧的过零率小于所述过零率阈值时,将记录的连续为第一等级帧或第二等级帧的帧数量初始化为0;
判断模块,用于判断连续为第一等级帧或第二等级帧的帧数量是否大于N且当前帧是否为第一等级帧;其中,N为预定数量,N为正整数;
异常判断模块,用于判断模块判断连续为第一等级帧或第二等级帧的帧数量大于N且当前帧为第一等级帧时,判断声音异常;
自学习模块,用于自学习音频阈值,计算并保存第一短时能量阈值、第二短时能量阈值和过零率阈值;
所述自学习模块包括:
计算单元,用于计算所述采集模块采集的音频信号的每一帧的短时能量和过零率;
统计单元,用于使用直方图分别统计所述音频信号的短时能量和过零率;
第一判断单元,用于判断本次自学习时间是否大于预定的学习时间;
正常声音计算单元,用于当判断本次自学习时间大于预定的学习时间时,则根据直方图计算本次学习正常声音的短时能量和过零率,所述正常声音的短时能量为短时能量直方图中数值最大的组对应的取值范围的中值;所述正常声音过零率为过零率直方图中数值最大的组对应的取值范围的中值;
第二判断单元,用于判断本次学习是否为初次学习;
阈值计算单元,用于当判断本次学习为初次学习时,根据所述正常声音的短时能量和所述正常声音的过零率计算第一短时能量阈值、第二短时能量阈值和过零率阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市智美达科技有限公司,未经深圳市智美达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410765322.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:内容再现方法及装置
- 下一篇:基于嵌入式GPU系统的并行化语音识别系统及方法