[发明专利]异常声音检测方法及系统有效
申请号: | 201410765322.5 | 申请日: | 2014-12-11 |
公开(公告)号: | CN104538041B | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 杨闯;周蕾蕾 | 申请(专利权)人: | 深圳市智美达科技有限公司 |
主分类号: | G10L25/21 | 分类号: | G10L25/21;G10L25/51 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 邓云鹏 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 短时能量 等级帧 异常声音 频域变换 时域特征 实时采集 实时处理 特征参数 音频信号 音频信息 复杂度 检测 采集 分析 | ||
本发明公开了一种异常声音检测方法和系统,通过比较采集的音频信号的每一帧的短时能量与第一短时能量阈值的大小,若大于第一短时能量阈值,则该帧记为第一等级帧,若小于第一短时能量阈值,则比较其短时能量与第二阈值的大小或其过零率与过零率阈值的大小,将短时能量大于第二短时能量阈值或过零率大于过零率阈值的帧记为第二等级帧,若连续为第一等级帧或第二等级帧的帧数量大于N且当前帧为第一等级帧时,则判断声音异常。该方法通过计算短时能量和过零率判断异常声音,由于短时能量和过零率属于时域特征,不涉及频域变换和特征参数的计算,能够降低计算的复杂度。同时,通过对实时采集的音频信息进行处理,能够实时处理分析,及时判断异常。
技术领域
本发明涉及声音检测领域,尤其涉及一种异常声音检测方法及系统。
背景技术
近年来,安全问题已经成为社会关注的焦点,视频监控系统在安防等领域得到了广泛的发展。但是,目前的视频监控系统主要是基于视频信号的,视频分析存在一定的局限性。比如,采集到的视频图像质量容易受到天气、光照变化和物体之间相互遮挡等因素的影响,并且图像处理算法复杂,计算复杂度较高。相对于视频信号,音频信号分布非常广泛并包含了大量的信息,具有易于分析和计算复杂度低的特点,可以辅助视频监控系统的视频分析。在一些情况下,音频信号甚至比视频信号传达了更重要的信息,比如公共场所的枪声,异常声音能够有效的揭示异常状况以及突发事故,受到越来越多的关注。
异常声音属于非语音信号,目前对异常声音检测的研究还比较缓慢,有学者将异常声音检测技术用于检查健康状况,通过研究人呼吸声音的特征向量来寻找异常声音;有科研人员通过计算每一个声音帧的特征向量与模板进行比较来判断环境中是否有异常声音,这种方法计算量大,实时性不好;还有研究通过计算特征参数和训练来对异常声音进行细致分类,分成爆炸声、枪声和玻璃破碎声等,同样计算量比较大。
发明内容
基于此,有必要针对计算量大的问题,提供一种计算复杂度低的异常声音检测方法及系统。
一种异常声音检测方法,包括步骤:
实时采集音频信号;
计算采集的音频信号的每一帧的短时能量和/或过零率;
获取第一短时能量阈值;
依次比较音频信号的每一帧的短时能量与第一短时能量阈值的大小;
若当前帧的短时能量大于第一短时能量阈值,则将当前帧记为第一等级帧;
若当前帧的短时能量小于第一短时能量阈值,则获取第二短时能量阈值和/或过零率阈值,根据第二短时能量阈值或过零率阈值确认是否将前帧记为第二等级帧,确认是否将前帧记为第二等级帧的步骤包括:
若当前帧的短时能量大于第二短时能量阈值或若当前帧的过零率大于过零率阈值,则将当前帧记为第二等级帧;
计录连续为第一等级帧或第二等级帧的帧数量;
判断连续为第一等级帧或第二等级帧的帧数量是否大于N且当前帧是否为第一等级帧,其中,N为预定数量,N为正整数;
若是,则判断声音异常。
在一种实施方式中,若比较当前帧的短时能量小于第二短时能量阈值或若当前帧的过零率小于过零率阈值,则将所记录的连续为第一等级帧或第二等级帧的帧数量初始化为0。
在一种实施方式中,在获取第一短时能量阈值的步骤之前还包括:
自学习音频阈值,计算并保存第一短时能量阈值、第二短时能量阈值和过零率阈值。
在一种实施方式中,自学习音频的步骤,具体包括:
采集用于自学习的音频信号;
计算所采集的音频信号的每一帧的短时能量和过零率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市智美达科技有限公司,未经深圳市智美达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410765322.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:内容再现方法及装置
- 下一篇:基于嵌入式GPU系统的并行化语音识别系统及方法