[发明专利]音频信号的分类方法及装置有效

申请号：	200910129157.3	申请日：	2009-03-27
公开（公告）号：	CN101847412A	公开（公告）日：	2010-09-29
发明（设计）人：	许丽净;吴顺妹;陈立维;张清	申请（专利权）人：	华为技术有限公司
主分类号：	G10L19/02	分类号：	G10L19/02;G10L15/08
代理公司：	北京中博世达专利商标代理有限公司 11274	代理人：	申健
地址：	518129 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频信号分类方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信技术领域，尤其涉及一种音频信号的分类方法及装置。

背景技术

语音编码器擅长于在中低码率下对语音类型的音频信号进行编码，而对音乐类型的音频信号编码效果则欠佳；音频编码器适用于在高码率下对语音类型和音乐类型的音频信号进行编码，但在中低码率下对语音类型的音频信号编码效果不够理想。为了使语音音频混合的音频信号在中低码率下能够取得良好的编码效果，一个适用于在中低码率下的语音音频编码器的编码过程主要包括：首先利用信号分类模块判别音频信号的类型，再根据判别出来的音频信号的类型选择对应的编码方法，对于语音类型的音频信号选择语音编码器，对于音乐类型的音频信号选择音频编码器。

在现有技术当中，对于上述判别音频信号的类型的方法主要包括：

1、利用窗函数将输入信号划分为一系列的重叠的帧；

2、利用快速傅里叶变换(FFT)计算每帧的频谱系数；

3、根据每帧的频谱系数，对于每个段计算五个方面的特征参数：谐波、噪音、拖尾、拖延及节奏；

4、基于上述特征参数的值，把音频信号分为六类：语音类型、音乐类型、噪音类型、短序列、待定序列、及短待定序列。

在实现上述判别音频信号的类型的过程中，发明人发现现有技术中至少存在如下问题：该方法在分类的过程中需要计算多方面的特征参数，对于音频信号的分类也较复杂，由此而导致了分类复杂度较高。

发明内容

本发明的实施例提供一种音频信号的分类方法及装置，降低音频信号分类复杂度，减少运算量。

为达到上述目的，本发明的实施例采用如下技术方案：

一种音频信号的分类的方法，包括：

获取待分类音频信号在至少一个子带中的音调特征参数；

根据获取的特征参数判定所述待分类音频信号的类型。

一种音频信号的分类的装置，包括：

音调获取模块，用于获取待分类音频信号在至少一个子带中的音调特征参数；

分类模块，用于根据获取的特征参数判定所述待分类音频信号的类型。

本发明实施例提供的方案通过采用音频信号的音调特性对音频信号进行分类的技术手段，克服了现有技术中在对音频信号分类时分类复杂的技术问题，进而达到了降低音频信号分类复杂度，减少分类时所需要的运算量的技术效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1音频信号的分类方法的流程图；

图2为本发明实施例2音频信号的分类方法的流程图；

图3为本发明实施例3音频信号的分类方法的流程图；

图4为本发明实施例4音频信号的分类装置的框图；

图5为本发明实施例5音频信号的分类装置的框图；

图6为本发明实施例6音频信号的分类装置的框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种音频信号的分类方法及装置，该方法的具体执行过程包括：获取待分类音频信号在至少一个子带中的音调特征参数；根据获取的特征参数判定所述待分类音频信号的类型。

该方法通过包括如下模块的装置实现：音调获取模块和分类模块。其中，该音调获取模块用于获取待分类音频信号在至少一个子带中的音调特征参数；分类模块用于根据获取的特征参数判定所述待分类音频信号的类型。

本发明实施例提供音频信号的分类方法及装置，通过获取音调特征参数便可以判断出待分类音频信号的类型，需要计算的特征参数的方面少，分类方法简单，降低了分类过程中的运算量。

实施例1

本实施例提供一种音频信号的分类方法，如图1所示，该方法包括如下步骤：

501，接收到当前一帧音频信号，该音频信号即为待分类音频信号。

具体为：设采样频率为48kHz，帧长N＝1024个样本点，接收到的当前一帧音频信号为第k帧音频信号。

下述为计算当前一帧音频信号的音调特征参数的过程。

502，计算该当前一帧音频信号的功率谱密度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910129157.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种核电站数字化控制组态的仿真调试方法及其系统
下一篇：像素电路与其驱动方法以及所应用的显示面板与显示器

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频信号的分类方法及装置有效

专利文献下载