[发明专利]音频信号的分类方法及装置有效
申请号: | 200910129157.3 | 申请日: | 2009-03-27 |
公开(公告)号: | CN101847412A | 公开(公告)日: | 2010-09-29 |
发明(设计)人: | 许丽净;吴顺妹;陈立维;张清 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L15/08 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 分类 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种音频信号的分类方法及装置。
背景技术
语音编码器擅长于在中低码率下对语音类型的音频信号进行编码,而对音乐类型的音频信号编码效果则欠佳;音频编码器适用于在高码率下对语音类型和音乐类型的音频信号进行编码,但在中低码率下对语音类型的音频信号编码效果不够理想。为了使语音音频混合的音频信号在中低码率下能够取得良好的编码效果,一个适用于在中低码率下的语音音频编码器的编码过程主要包括:首先利用信号分类模块判别音频信号的类型,再根据判别出来的音频信号的类型选择对应的编码方法,对于语音类型的音频信号选择语音编码器,对于音乐类型的音频信号选择音频编码器。
在现有技术当中,对于上述判别音频信号的类型的方法主要包括:
1、利用窗函数将输入信号划分为一系列的重叠的帧;
2、利用快速傅里叶变换(FFT)计算每帧的频谱系数;
3、根据每帧的频谱系数,对于每个段计算五个方面的特征参数:谐波、噪音、拖尾、拖延及节奏;
4、基于上述特征参数的值,把音频信号分为六类:语音类型、音乐类型、噪音类型、短序列、待定序列、及短待定序列。
在实现上述判别音频信号的类型的过程中,发明人发现现有技术中至少存在如下问题:该方法在分类的过程中需要计算多方面的特征参数,对于音频信号的分类也较复杂,由此而导致了分类复杂度较高。
发明内容
本发明的实施例提供一种音频信号的分类方法及装置,降低音频信号分类复杂度,减少运算量。
为达到上述目的,本发明的实施例采用如下技术方案:
一种音频信号的分类的方法,包括:
获取待分类音频信号在至少一个子带中的音调特征参数;
根据获取的特征参数判定所述待分类音频信号的类型。
一种音频信号的分类的装置,包括:
音调获取模块,用于获取待分类音频信号在至少一个子带中的音调特征参数;
分类模块,用于根据获取的特征参数判定所述待分类音频信号的类型。
本发明实施例提供的方案通过采用音频信号的音调特性对音频信号进行分类的技术手段,克服了现有技术中在对音频信号分类时分类复杂的技术问题,进而达到了降低音频信号分类复杂度,减少分类时所需要的运算量的技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1音频信号的分类方法的流程图;
图2为本发明实施例2音频信号的分类方法的流程图;
图3为本发明实施例3音频信号的分类方法的流程图;
图4为本发明实施例4音频信号的分类装置的框图;
图5为本发明实施例5音频信号的分类装置的框图;
图6为本发明实施例6音频信号的分类装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种音频信号的分类方法及装置,该方法的具体执行过程包括:获取待分类音频信号在至少一个子带中的音调特征参数;根据获取的特征参数判定所述待分类音频信号的类型。
该方法通过包括如下模块的装置实现:音调获取模块和分类模块。其中,该音调获取模块用于获取待分类音频信号在至少一个子带中的音调特征参数;分类模块用于根据获取的特征参数判定所述待分类音频信号的类型。
本发明实施例提供音频信号的分类方法及装置,通过获取音调特征参数便可以判断出待分类音频信号的类型,需要计算的特征参数的方面少,分类方法简单,降低了分类过程中的运算量。
实施例1
本实施例提供一种音频信号的分类方法,如图1所示,该方法包括如下步骤:
501,接收到当前一帧音频信号,该音频信号即为待分类音频信号。
具体为:设采样频率为48kHz,帧长N=1024个样本点,接收到的当前一帧音频信号为第k帧音频信号。
下述为计算当前一帧音频信号的音调特征参数的过程。
502,计算该当前一帧音频信号的功率谱密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910129157.3/2.html,转载请声明来源钻瓜专利网。