[发明专利]一种基于哼唱的音乐检索方法无效
申请号: | 201010144497.6 | 申请日: | 2010-04-12 |
公开(公告)号: | CN101916250A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 隆克平;刘健;侯锦峰;徐杰 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10H1/00 |
代理公司: | 北京市路盛律师事务所 11326 | 代理人: | 温利平 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 哼唱 音乐 检索 方法 | ||
1.一种基于哼唱的音乐检索方法,其特征在于,包括以下步骤:
(1)、将音乐数据库中的每首音乐根据能量进行音符分割,得到音符序列;对每个音符进行基音提取,提取出该音符的频率,即音高,并转换成音差,然后除以该音符的相对长度,计算出该音符的坡度,得到每首音乐的坡度序列,将每首音乐的坡度序列作为该首音乐的索引,形成索引化的音乐数据库;
音差是指当前音符与上一个音符在音高上的差距,相对长度是指某一音符的时间长度除以所有音符的平均时间长度得到的相对值;
(2)、将用户哼唱待检索音乐中的一段旋律作为检索的旋律关键字,使用音频采集设备采集旋律关键字,得到旋律关键字的音频数据;
(3)、将旋律关键字的音频数据按照步骤(1)中的相同方法,进行音符分割、基音提取并转换成音差,然后除以音符的相对长度,计算出该音符的坡度,这样得到旋律关键字的坡度序列;
(4)、将旋律关键字的坡度序列与音乐数据库中每首音乐的索引进行匹配,从音乐数据库中选出与旋转关键字相似度最高的一组音乐,并按照相似度由高到低进行排列,以便用户进一步进行人工选取音乐。
2.根据权利要求1所述的基于哼唱的音乐检索方法,其特征在于,所述的音符分割采用如下步骤:
a1:旋律关键字的音频数据或音乐数据库中的每首音乐以10ms的数据作为一帧进行分割;
a2:设置能量阈值,将旋律关键字的音频数据帧平均平方根能量的50%和30%分别设为音符的开始阈值和结束阈值,当一个帧的能量超过旋律关键字的音频数据帧平均平方根能量的50%时,认为该帧是一个音符的开始,当一个帧的能量低于旋律关键字的音频数据帧平均平方根能量的30%时,认为该帧是一个音符的结束;
a3:设置100ms的时间阈值来剔除毛刺,即当音符长度小于100ms时,则认为是短时毛刺忽略掉。
3.根据权利要求1所述的基于哼唱的音乐检索方法,其特征在于,所述的音符基音提取采用如下步骤:
b1:将长度为T的音符分为长为τ的N段(1<τ≤T):
T=Nτ+b,0≤b≤τ;
b2:然后根据下式求和:
式中r(t)表示音符数据;
b3:再对下面的目标函数:
求极大值得到τ0,τ0即为音符的周期;
b4:求出音符的基音频率freq=1/τ0,再通过公式
Semitone=12*log2(freq/440)+69
将基音频率转换成半音(Semitone)单位,从而得到音符基音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010144497.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:剩余电流保护开关
- 下一篇:非易失性半导体存储器件