[发明专利]异常声音检测方法及系统有效
申请号: | 201410765322.5 | 申请日: | 2014-12-11 |
公开(公告)号: | CN104538041B | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 杨闯;周蕾蕾 | 申请(专利权)人: | 深圳市智美达科技有限公司 |
主分类号: | G10L25/21 | 分类号: | G10L25/21;G10L25/51 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 邓云鹏 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种异常声音检测方法和系统,通过比较采集的音频信号的每一帧的短时能量与第一短时能量阈值的大小,若大于第一短时能量阈值,则该帧记为第一等级帧,若小于第一短时能量阈值,则比较其短时能量与第二阈值的大小或其过零率与过零率阈值的大小,将短时能量大于第二短时能量阈值或过零率大于过零率阈值的帧记为第二等级帧,若连续为第一等级帧或第二等级帧的帧数量大于N且当前帧为第一等级帧时,则判断声音异常。该方法通过计算短时能量和过零率判断异常声音,由于短时能量和过零率属于时域特征,不涉及频域变换和特征参数的计算,能够降低计算的复杂度。同时,通过对实时采集的音频信息进行处理,能够实时处理分析,及时判断异常。 | ||
搜索关键词: | 短时能量 等级帧 异常声音 频域变换 时域特征 实时采集 实时处理 特征参数 音频信号 音频信息 复杂度 检测 采集 分析 | ||
【主权项】:
1.一种异常声音检测方法,包括步骤:实时采集音频信号;计算采集的音频信号的每一帧的短时能量和/或过零率;获取第一短时能量阈值;依次比较所述音频信号的每一帧的短时能量与所述第一短时能量阈值的大小;若当前帧的短时能量大于第一短时能量阈值,则将所述当前帧记为第一等级帧;若当前帧的短时能量小于第一短时能量阈值,则获取第二短时能量阈值和/或过零率阈值,根据第二短时能量阈值或过零率阈值确认是否将所述前帧记为第二等级帧,所述确认是否将所述前帧记为第二等级帧的步骤包括:若当前帧的短时能量大于所述第二短时能量阈值或当前帧的过零率大于所述过零率阈值,则将所述当前帧记为第二等级帧;计录连续为第一等级帧或第二等级帧的帧数量;若比较当前帧的短时能量小于第二短时能量阈值或若当前帧的过零率小于所述过零率阈值,则将所记录的连续为第一等级帧或第二等级帧的帧数量初始化为0;判断连续为第一等级帧或第二等级帧的帧数量是否大于N且当前帧是否为第一等级帧,其中,N为预定数量,N为正整数;若是,则判断声音异常;在所述获取第一短时能量阈值的步骤之前还包括:自学习音频阈值,计算并保存第一短时能量阈值、第二短时能量阈值和过零率阈值;所述自学习音频的步骤,具体包括:采集用于自学习的音频信号;计算所采集的音频信号的每一帧的短时能量和过零率;使用直方图分别统计所述音频信号的短时能量和过零率;判断本次自学习时间是否大于预定的学习时间;若判断本次自学习时间大于预定的学习时间,则根据直方图计算本次学习正常声音的短时能量和过零率,所述正常声音的短时能量为短时能量直方图中数值最大的组对应的取值范围的中值;所述正常声音过零率为过零率直方图中数值最大的组对应的取值范围的中值;判断本次学习是否为初次学习;若判断本次学习为初次学习,根据所述正常声音的短时能量和所述正常声音的过零率计算第一短时能量阈值、第二短时能量阈值和过零率阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市智美达科技有限公司,未经深圳市智美达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410765322.5/,转载请声明来源钻瓜专利网。
- 上一篇:内容再现方法及装置
- 下一篇:基于嵌入式GPU系统的并行化语音识别系统及方法