[发明专利]伴奏音乐提取方法及装置有效

申请号：	200910079834.5	申请日：	2009-03-12
公开（公告）号：	CN101577117A	公开（公告）日：	2009-11-11
发明（设计）人：	张晨	申请（专利权）人：	北京中星微电子有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;H04S1/00;H04S7/00
代理公司：	北京同达信恒知识产权代理有限公司	代理人：	郭润湘
地址：	100083北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	伴奏音乐提取方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种伴奏音乐提取方法，其特征在于，包括：

获取待处理歌曲中的合成音频信号帧，所述合成音频信号帧由所述歌曲左声道的音频信号帧和右声道的对应音频信号帧合成；

确定所述合成音频信号帧所属的音频类别为语音、音乐或语音音乐组合；

根据确定出的所述音频类别，设定对消增益参数和输出增益参数，具体包括：

当确定所述合成音频信号帧所属的音频类别为语音时，分别设置所述对消增益参数和输出增益参数为a1和b1；

当确定所述合成音频信号帧所属的音频类别为音乐时，分别设置所述对消增益参数和输出增益参数为a2和b2；

当确定所述合成音频信号帧所属的音频类别为语音音乐组合时，分别设置所述对消增益参数和输出增益参数为a3和b3；

其中，0≤a2＜a3＜a1≤1，0＜b1＜b3＜b2≤1；

计算所述左声道的音频信号帧与所述对消增益参数的乘积；

用所述乘积减去所述右声道的对应音频信号帧，得到对消后左声道的音频信号帧；计算所述对消后左声道的音频信号帧与所述输出增益参数的乘积，得到左声道的输出信号帧；以及

用所述右声道的对应音频信号帧减去所述左声道的音频信号帧与所述对消增益参数的乘积，得到对消后右声道的音频信号帧；计算所述对消后右声道的音频信号帧与所述输出增益参数的乘积，得到右声道的输出信号帧。

2.如权利要求1所述的方法，其特征在于，确定所述合成音频信号帧所属的音频类别，具体包括：

对所述合成音频信号帧进行频带划分，分别计算划分出的各子频带的频域能量，得到由所有子频带频域能量组成的能量向量；

根据所述能量向量和存储的各个音频类别的分类模型参数，采用混合高斯模型GMM算法，分别计算得到所述合成音频信号帧为各音频类别的概率；其中，每个音频类别的分类模型参数根据已知的该音频类别的若干音频信号帧确定；

确定所述概率最大值所对应的音频类别为所述合成音频信号帧所属的音频类别。

3.如权利要求2所述的方法，其特征在于，所述对所述合成音频信号帧进行频带划分，具体包括：

将所述合成音频信号帧划分为不均匀的L个频带，划分出的第k个子频带的起始频率～终止频率定义为：或或

将所述合成音频信号帧划分为均匀的L个频带，划分出的第k个子频带的起始频率～终止频率定义为：

其中，F为所述合成音频信号帧的频带宽度，k＝0，1，......，L-1；且L 为大于等于1的正整数；

所述计算划分出的各子频带的频域能量，具体为：根据所述合成音频信号帧的频率分布函数和各子频带的所述起始频率、终止频率，计算各个子频带的频域能量。

4.如权利要求3所述的方法，其特征在于，所述计算得到所述合成音频信号帧为各音频类别的概率，具体包括：

根据所述能量向量和所述各个音频类别的分类模型参数，计算得到与所述合成音频数据帧与各个音频类别对应的基本密度函数：

根据所述基本密度函数计算得到所述合成音频信号帧为各音频类别的概率。

5.如权利要求2所述的方法，其特征在于，所述分类模型参数的确定，具体包括：

提取一组某一音频类别的备用音频信号帧；

对获取的每一个备用音频信号帧进行频带划分，分别计算划分出的各子频带的频域能量，得到由所有子频带频域能量组成的能量向量；

根据得到的所有备用音频信号帧的能量向量和设定的高斯混合模型参数初始值，采用最大似然估计迭代算法，确定该音频类别的音频信号分类模型参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京中星微电子有限公司，未经北京中星微电子有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910079834.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载