[发明专利]一种基于音乐指纹特征的音乐检索方法及系统有效
申请号: | 201410095561.4 | 申请日: | 2014-03-14 |
公开(公告)号: | CN103853836B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 孔秋强 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 张月光 |
地址: | 510665 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音乐 指纹 特征 检索 方法 系统 | ||
1.一种基于音乐指纹特征的音乐检索方法,其特征在于,包括:
构建音乐指纹索引,输入音频信号并进行预处理获取音频频谱图,在频谱图内选取第一锚点、第二锚块和第三锚块进行组合,得到指纹并将其插入到哈希表内,记录该指纹出现的歌曲ID和在歌曲内的位置;
音乐检索,提取待检索音乐片段的指纹序列,通过查找哈希表得到各指纹对应的歌曲ID和歌曲位置链表,构建歌曲ID与指纹对应的匹配表,将匹配表内重复最多的歌曲内位置作为命中数,将命中数最多的歌曲作为检索结果;
所述第一锚点的获取方式为:将频谱图切分为M×N块,其中M是指将频谱图纵向频域均匀划分为M个频带,每个频带为a个点;N是指将频谱图横向时域以步长b为单位切割为N个部分;
在每块中选取一个幅值最大的点最为第一锚点,并将第一锚点附近R*R的区域内的点赋值为0;
所述第二锚块的获取方式为:以第一锚点为起点,在时移b帧后的矩形区域内搜索第二锚块;将该矩形区域划分为X个3*3小块,在每个3*3小块内选择最大的幅值作为该3*3小块的小块代表值,在该矩形区域内选择小块代表值最大的3*3小块的作为第二锚块,并以第二锚块为中心将R*R的区域内的点赋值为0;
所述第三锚块的获取方式为:以第一锚点为起点,在时移b帧后的矩形区域内搜索第三锚块;将该矩形区域划分为Y个小矩形区域,每个小矩形区域划分为y个2*2小块;在每个2*2小块内选择最大的幅值作为该2*2小块的小块代表值,在小矩形区域内选取出幅值最大的2*2小块,在大矩形内选择Z个2*2小块。
2.根据权利要求1所述的基于音乐指纹特征的音乐检索方法,其特征在于,所述预处理是通过对输入的音频信号进行短时傅里叶变换获取音频频谱图,在频谱图尾部进行补白,对补白后的频谱图进行滤波。
3.根据权利要求2所述的基于音乐指纹特征的音乐检索方法,其特征在于,所述对补白后音频频谱图进行滤波方式是梯形带通滤波。
4.根据权利要求1所述的基于音乐指纹特征的音乐检索方法,其特征在于,所述在音乐检索时,对待检索音乐片段在前端补白若干次分别进行检索。
5.根据权利要求4所述的基于音乐指纹特征的音乐检索方法,其特征在于,所述在音乐检索时,对待检索音乐片段在前端补白8次分别进行检索。
6.根据权利要求1所述的基于音乐指纹特征的音乐检索方法,其特征在于,所述b=8,R=5,Z=4。
7.根据权利要求1所述的基于音乐指纹特征的音乐检索方法,其特征在于,还包括对音乐指纹索引中构建的哈希表进行剪枝。
8.一种基于音乐指纹特征的音乐检索系统,其特征在于,包括:
音乐指纹索引模块,用于对输入的音频信号进行预处理获取音频频谱图,在频谱图内选取第一锚点、第二锚块和第三锚块进行组合,得到指纹并将其插入到哈希表内,记录该指纹出现的歌曲ID和在歌曲内的位置;
音乐检索模块,用于提取待检索音乐片段的指纹序列,通过查找哈希表得到各指纹对应的歌曲ID和歌曲位置链表,构建歌曲ID与指纹对应的匹配表,将匹配表内重复最多的歌曲内位置作为命中数,将命中数最多的歌曲作为检索结果;
所述音乐指纹索引模块还包括第一锚点选取模块、第二锚块选取模块和第三锚块选取模块;
所述第一锚点选取模块,是将频谱图切分为M×N块,其中M是指将频谱图纵向频域均匀划分为M个频带,每个频带为a个点;N是指将频谱图横向时域以步长b为单位切割为N个部分;
在每块中选取一个幅值最大的点最为第一锚点,并将第一锚点附近R*R的区域内的点赋值为0;
所述第二锚块选取模块,是以第一锚点为起点,在时移b帧后的矩形区域内搜索第二锚块;将该矩形区域划分为X个3*3小块,在每个3*3小块内选择最大的幅值作为该3*3小块的小块代表值,在该矩形区域内选择小块代表值最大的3*3小块的作为第二锚块,并以第二锚块为中心将R*R的区域内的点赋值为0;
所述第三锚块选取模块,是以第一锚点为起点,在时移b帧后的矩形区域内搜索第三锚块;将该矩形区域划分为Y个小矩形区域,每个小矩形区域划分为y个2*2小块;在每个2*2小块内选择最大的幅值作为该2*2小块的小块代表值,在小矩形区域内选取出幅值最大的2*2小块,在大矩形内选择Z个2*2小块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410095561.4/1.html,转载请声明来源钻瓜专利网。