[发明专利]一种音高检测方法在审
申请号: | 201410383633.5 | 申请日: | 2014-08-06 |
公开(公告)号: | CN104200818A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 张天骐;徐昕;张刚;石穗;张亚娟 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L25/90 | 分类号: | G10L25/90;G10L25/18;G10L25/24 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音高 检测 方法 | ||
技术领域
本发明涉及音频信号处理,具体为一种纯音乐信号在不同噪声环境下的音高检测方法。
背景技术
音乐中音符音调的高低情况称之为音高,音高是由本征频率,即基频所决定,且与频率成反比关系。音高是描述音乐的一个重要参数,在哼唱检索、音乐识别及音乐分离等领域起到关键作用。能否快速且准确的检测出音高,直接影响了相关系统的各项性能。
随着互联网和数字音乐的发展,人们接触音乐的途径越来越多,如何快速且准确的找到自己想要的音乐是目前许多相关公司和用户所面临的一大难题。现有的音乐检索特征提取算法,主要方向都离不开准确音高这一显著特征。原因主要是易于接触的音频格式的音乐没有像MIDI音乐那样可直接利用的音高信息,如WAV、MP3等格式的音乐。所以目前的音乐检索算法思路大多都是从音频信号中提取音高、节拍等信息,从而将其转化成为MIDI格式音乐检索情形,这样诸多问题也就迎刃而解。目前为止,许多研究者在此方面做出了杰出贡献,Chias和McNab在哼唱检索中用符号U、D、S(或R)表示音高的变化,但是这种简化在数据库很大时的检索正确率很低。Hung用音高、音长、音强三元组合来描述音乐的特征,虽然提高了检索准确度,但是该算法复杂度较高,且对多声部的音乐检索性能欠佳。
音乐识别领域中音高的主要三种识别方法是时域的并行处理法,频域的谐波峰值法以及时频域的小波算法。在录音质量差、波形残缺时,并行处理法出错率很高,且对于有简单和弦伴奏的乐曲,并行处理法和小波算法都会无效,而谐波峰值法在基频分量小、偶次谐波丰富的场合误判可能性增大,所以目前还没有一种很好的办法解决不同种音乐的音高检测问题。综上可知,找到一个检测精度高、鲁棒性好的音高检测算法很有必要。
发明内容
本方明针对基于内容的音乐检索中音高检测技术较差的问题,提出一种谐波峰值法结合倒谱法(CEP)的音高检测方法。该方法可以对不同乐器在不同噪声下的乐曲进行音高检测,且检测正确率较高,鲁棒性较好。
本发明解决上述问题的技术方案是,先对音乐信号进行傅里叶变换(FFT)得到频谱,根据峰值检测法找出5个较低频率处的谐波峰,并按其对应频率大小升序排列,然后计算各频率间的比值,以此确定一组音高候选序列,再将此候选序列与倒谱法所算得的音高合并到一起组成新的音高候选序列,最后利用置 信度和维特比算法对候选音高序列进行筛选,得到标准音高。具体步骤如下:
步骤1:将采集的音乐信号x(n)通过带通滤波器后,进行预处理,得到短时平稳信号;
步骤2:对所述短时平稳信号利用基于信号频谱特征的方法检测出音符起点,然后利用中值门限加均值门限对音符起点进行伪峰值剔除,完成音符分割;
步骤3:对完成音符分割后的信号采用谐波峰值法计算出一组音高候选序列,再通过倒谱法计算该完成音符分割后的信号的音高,得到另一组音高候选序列,将两组音高候选序列组成一个新的候选音高序列;
步骤4:对所述新的候选音高序列利用置信度筛选掉序列中的一部分音高候选值,将具有最大置信度的候选音高作为最佳音高候选值,并将这些值组成最佳音高候选序列;在最佳音高候选序列中利用维特比算法计算出代价函数,该最小代价函数对应的音高即为标准音高。
将本发明与经典的YIN算法、倒谱法(CEP)、HPS算法进行比较,具有如下优点:
本发明可以对不同乐器的乐曲进行音高检测,对以往单一音源的检测方法有了很大改进,而且对于常见的几种噪声(白(white)噪声、粉红(pink)噪声、工厂(factory)噪声、babble噪声)有很好的鲁棒性,抗噪性能明显优于其它几种方法,在较低信噪比情况下的检测精度较之其它几种方法也有很大提高。
附图说明
图1为理想情况下钢琴单个音符示意图;
图2为音符分割效果图;图中a为《昨日重现》时域波形图,b为对应a的突出outset点检测图,c为对应a峰值提取(音符分割)结果图;
图3为谐波峰值法原理流程图;
图4为倒谱法原理框图;
图5为改进方法的整体流程框图;
图6为不同乐器不同方法的音高比较图;图中a为小提琴音高序列比较图;b为钢琴音高序列比较图;
图7为不同噪声下音高序列比较图;
图8为不同乐器不同方法的音高检测性能比较图;图中a为小号音高检测率比较图;b为竖笛音高检测率比较图;c为小提琴音高检测率比较图;d为钢琴音高检测率比较图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学;,未经重庆邮电大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410383633.5/2.html,转载请声明来源钻瓜专利网。