[发明专利]一种音乐识别方法及系统有效
申请号: | 201710077359.2 | 申请日: | 2017-02-14 |
公开(公告)号: | CN106919662B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 李伟 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/68 | 分类号: | G06F16/68 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王加贵 |
地址: | 200082 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音乐 识别 方法 系统 | ||
1.一种音乐识别方法,其特征在于,所述方法包括:
获取待识别音乐片段;
提取所述待识别音乐片段中每一帧音频的梅尔倒谱系数、梅尔倒谱系数一阶差分、线性预测倒谱系数和感知线性预测系数;
利用所述音频的梅尔倒谱系数、梅尔倒谱系数一阶差分、线性预测倒谱系数和感知线性预测系数构成所述音频的特征向量;
对每一帧所述音频的特征向量进行组合,得到所述待识别音乐片段的特征矩阵;
将所述待识别音乐片段的特征矩阵与音乐库中的样本音乐特征矩阵进行比较,得到最大相似度特征矩阵,所述最大相似度特征矩阵为与所述待识别音乐片段的相似度最大的样本音乐特征矩阵;
获取所述相似度最大的样本音乐特征矩阵的音乐信息;
将所述音乐信息输出;
其中,所述将所述待识别音乐片段的特征矩阵与音乐库中的样本音乐特征矩阵进行比较,得到相似度最大样本音乐特征矩阵,具体包括:
从所述样本音乐特征矩阵中截取与所述待识别音乐片段的特征矩阵具有相同行数的矩阵所述样本音乐特征矩阵有多个,其中,k=1,2,…,M-N+1,Δk=1,tz(1),tz(2),…,tz(M)为所述样本音乐特征矩阵B中每一帧音频的特征向量,M为所述音乐特征矩阵B中特征向量的个数,N为所述待识别音乐片段的特征矩阵的行数,将矩阵Bk标记为待比较特征矩阵;
计算待比较特征矩阵与所述待识别音乐片段的特征矩阵的相似度,得到与所述待识别音乐片段的特征矩阵相似度最大的待比较特征矩阵,所述与所述待识别音乐片段的特征矩阵相似度最大的待比较特征矩阵所属的音乐特征矩阵即为最大相似度音乐特征矩阵。
2.根据权利要求1所述的识别方法,其特征在于,在所述获取一段待识别音乐之后,提取所述待识别音乐中每一帧音频的梅尔倒谱系数、梅尔倒谱系数一阶差分、线性预测倒谱系数和感知线性预测系数之前,还包括:
对所述待识别音乐片段进行预处理,所述预处理包括预加重处理、分帧和加窗。
3.根据权利要求1所述的识别方法,其特征在于,在所述从所述音乐特征矩阵中截取与所述待识别音乐片段的特征矩阵具有相同行数的矩阵其中,Δk=1,k=1,2,…,M-N+1,tz(1),tz(2),…,tz(M)为所述音乐特征矩阵B中每一帧音频的特征向量,M为所述音乐特征矩阵B中特征向量的个数,N为所述待识别音乐片段的特征矩阵的行数之前,还包括:
判断是否需要在预设时间内完成计算,且对准确度要求小于预设阈值;
如果是,则将Δk设置为大于1的整数。
4.根据权利要求1所述的识别方法,其特征在于,所述计算待比较特征矩阵与所述待识别音乐片段的特征矩阵的相似度,具体包括:
利用矩阵绝对值距离法、向量空间模型的余弦定理法或者向量空间模型的余弦定理与欧几里得距离相结合的方法计算所述待比较特征矩阵与所述待识别音乐片段的特征矩阵的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710077359.2/1.html,转载请声明来源钻瓜专利网。