[发明专利]一种基于音乐指纹特征的音乐检索方法及系统有效
申请号: | 201410095561.4 | 申请日: | 2014-03-14 |
公开(公告)号: | CN103853836B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 孔秋强 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 张月光 |
地址: | 510665 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于音乐指纹特征的音乐检索方法及系统,其方法包括构建音乐指纹索引,输入音频信号并进行预处理获取音频频谱图,在频谱图内选取第一锚点、第二锚块和第三锚块进行组合,得到指纹并将其插入到哈希表内,记录该指纹出现的歌曲ID和在歌曲内的位置;音乐检索,提取待检索音乐片段的指纹序列,通过查找哈希表得到各指纹对应的歌曲ID和歌曲位置链表,构建歌曲ID与指纹对应的匹配表,将匹配表内重复最多的歌曲内位置作为命中数,将命中数最多的歌曲作为检索结果。本发明实现当音乐库达到百万级时快速检索;克服信道漂移的问题;提高指纹的抗噪性、鲁棒性;解决最少录音时间的限制;获得更紧致,占更少内存空间的指纹特征。 | ||
搜索关键词: | 一种 基于 音乐 指纹 特征 检索 方法 系统 | ||
【主权项】:
一种基于音乐指纹特征的音乐检索方法,其特征在于,包括:构建音乐指纹索引,输入音频信号并进行预处理获取音频频谱图,在频谱图内选取第一锚点、第二锚块和第三锚块进行组合,得到指纹并将其插入到哈希表内,记录该指纹出现的歌曲ID和在歌曲内的位置;音乐检索,提取待检索音乐片段的指纹序列,通过查找哈希表得到各指纹对应的歌曲ID和歌曲位置链表,构建歌曲ID与指纹对应的匹配表,将匹配表内重复最多的歌曲内位置作为命中数,将命中数最多的歌曲作为检索结果;所述第一锚点的获取方式为:将频谱图切分为M×N块,其中M是指将频谱图纵向频域均匀划分为M个频带,每个频带为a个点;N是指将频谱图横向时域以步长b为单位切割为N个部分;在每块中选取一个幅值最大的点作为第一锚点,并将第一锚点附近R*R的区域内的点赋值为0;所述第二锚块的获取方式为:以第一锚点为起点,在时移b帧后的矩形区域内搜索第二锚块;将该矩形区域划分为X个3*3小块,在每个3*3小块内选择最大的幅值作为该3*3小块的小块代表值,在该矩形区域内选择小块代表值最大的3*3小块的作为第二锚块,并以第二锚块为中心将R*R的区域内的点赋值为0;所述第三锚块的获取方式为:以第一锚点为起点,在时移b帧后的大矩形区域内搜索第三锚块;将该大矩形区域划分为Y个小矩形区域,每个小矩形区域划分为y个2*2小块;在每个2*2小块内选择最大的幅值作为该2*2小块的小块代表值,在小矩形区域内选取出幅值最大的2*2小块,在大矩形区域内选择Z个2*2小块作为第三锚块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410095561.4/,转载请声明来源钻瓜专利网。