[发明专利]一种音频信号检测方法和装置有效
申请号: | 200910110797.X | 申请日: | 2009-10-15 |
公开(公告)号: | CN102044246A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 王喆 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 检测 方法 装置 | ||
1.一种音频信号检测方法,其特征在于,包括:
将输入的音频信号分为多帧音频信号帧;
对每一帧音频信号帧进行背景检测;
当检测到背景信号帧时,将一个背景帧计数器加上一个步长值;获得所述背景信号帧的音乐特征值,将所述音乐特征值累加到一个背景音乐特征累加值;
当所述背景帧计数器达到一个预先设定的数量时,将所述背景音乐特征累加值与一个门限做比较,当背景音乐特征累加值符合门限判定法则时,则检测到背景音乐。
2.根据权利要求1所述的方法,其特征在于,获得所述背景信号帧的音乐特征值包括:
获得所述背景信号帧的频谱;
获得至少部分频谱上局部峰点的位置和能量;
根据位置和能量,分别计算所有局部峰点中每一个对应的归一化峰谷距离,得到多个归一化峰谷距离值;
根据所述多个归一化峰谷距离值,获得音乐特征值。
3.根据权利要求2所述的方法,其特征在于,采用如下方式计算所述局部峰点的归一化峰谷距离:
对于每一个局部峰点,分别获得其左右各相邻4个频点内的最小值;
计算局部峰值与左侧最小值的差值及局部峰值与右侧最小值的差值,用两个差值之和除以所述音频帧的频谱的能量均值或部分频谱能量均值,获得归一化峰谷距离。
4.根据权利要求2所述的方法,其特征在于,采用如下方式计算该峰点的归一化峰谷距离:
对于每一个局部峰点,计算所述局部峰点与左侧相邻的至少一个频点的距离,所述局部峰点与右侧相邻的至少一个频点的距离;
用两个距离之和除于所述音频帧的频谱能量均值或部分频谱能量均值,获得归一化峰谷距离。
5.根据权利要求2所述的方法,其特征在于,根据所述多个归一化峰谷距离值获得音乐特征值,包括:
选择归一化峰谷距离值的最大值作为音乐特征值;或
计算归一化峰谷距离值中最大的至少两个值之和,得到音乐特征值。
6.根据权利要求2所述的方法,其特征在于,所述门限判断法则为:所述音乐特征累加值大于门限。
7.根据权利要求1所述的方法,其特征在于,获得所述背景信号帧的音乐特征值包括:
根据背景信号帧的频谱,获得频谱上局部峰值对应的峰谷距离的最大值的第一位置;
根据背景信号帧的前一帧的频谱,获得频谱上局部峰值对应的峰谷距离的最大值的第二位置;
计算第一位置和第二位置的差值,得到音乐特征值。
8.根据权利要求7所述的方法,其特征在于,所述门限判断法则为:所述音乐特征累加值小于门限。
9.根据权利要求1所述的方法,其特征在于,检测到背景音乐后,还包括:
将当前音频帧之后的预定数量的音频帧标识为背景音乐。
10.根据权利要求9所述的方法,其特征在于,还包括:
当检测到背景信号帧时,则将预设的保护帧值减一,当保护帧值大于0,则所述门限采用第一门限值,否则所述门限采用第二门限值;其中,当所述门限判断法则为音乐特征累加值大于所述门限时,第一门限值小于第二门限值;当所述门限判断法则为音乐特征累加值小于所述门限时,第一门限值大于第二门限值。
11.一种编码器,其特征在于,包括:
背景帧识别器,用于对输入的每一帧音频信号进行检测,输出背景信号帧或前景信号帧的检测结果;
背景音乐识别器,用于当检测到背景信号帧时,根据所述背景信号帧的音乐特征值对所述背景信号帧进行检测,输出检测到背景音乐的检测结果;其中,所述背景音乐识别器包括:
背景帧计数器,用于当检测到背景信号帧时,将步长值加到其值上;
音乐特征值获得单元,用于获得所述背景信号帧的音乐特征值;
音乐特征值累加器,用于累加所述音乐特征值;
判决器,用于在背景帧计数器达到预先设定的数量时,确定背景特征累加值符合门限判定法则,输出检测到背景音乐的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910110797.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:闭门器调试装置
- 下一篇:一种视频文本分割方法