[发明专利]一种音乐识别方法及系统有效
申请号: | 201710077359.2 | 申请日: | 2017-02-14 |
公开(公告)号: | CN106919662B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 李伟 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/68 | 分类号: | G06F16/68 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王加贵 |
地址: | 200082 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音乐 识别 方法 系统 | ||
本发明公开了一种音乐识别方法及系统。该方法包括:获取待识别音乐片段;提取待识别音乐片段中每一帧音频的梅尔倒谱系数、梅尔倒谱系数一阶差分、线性预测倒谱系数和感知线性预测系数;利用音频的上述系数构成音频的特征向量;对每一帧所述音频的特征向量进行组合,得到待识别音乐片段的特征矩阵;将待识别音乐片段的特征矩阵与音乐库中的样本音乐特征矩阵进行比较,得到最大相似度特征矩阵,所述最大相似度特征矩阵为与待识别音乐片段的相似度最大的样本音乐特征矩阵;获取相似度最大的样本音乐特征矩阵的音乐信息;将音乐信息输出。本发明提供的音乐识别方法及系统具有更好的抗噪性和识别率,识别效果更加理想。
技术领域
本发明涉及音乐识别领域,特别是涉及一种音乐识别方法及系统。
背景技术
随着科学技术的蓬勃发展,尤其是计算机技术的产生和迅速发展,声音及音乐计算(Sound andMusic Computing,SMC)成为了一个新兴的交叉学科,该学科主要是通过计算方法来理解、模拟和产生声音及音乐。
随着各项技术的成熟与发展,人们可以通过多种渠道获取音乐。其中网络是最便捷、最快速的获取渠道。这直接导致了网络上的音乐产生了爆炸式的增长,人们也习惯通过网络检索下载音乐。但是通过网络传播的音乐并非都有完整的音乐信息标注,一方面对于管理造成了一定的难度,另一方面对于获取者的使用也造成了一定的困扰。同时在生活中,音乐往往只是单纯的播放,而音乐的相关信息如歌名、演唱者等,并不是一直伴随着音乐同时出现。这一情况,对于听到了音乐并对其感兴趣、希望了解和获取该音乐的音乐爱好者是一个十分棘手的问题。由此,对于音乐的检索成为了一个十分重要的问题。
音乐的检索主要有两种方式,一种是基于文本的音乐检索,另一种是基于内容的音乐检索。其中,基于文本的音乐检索系统主要通过用户提交关键字信息,如歌名、歌手名、歌词片段等,然后使用关键字对数据库中的音乐信息进行检索和匹配,从而实现目的。该技术已经十分成熟并得到广泛使用,但是其局限性也是十分明显的。该方式对于无法提供明确关键字信息的未知音频无法进行检索和识别,并且用户提供的关键字信息也十分容易产生错误,导致检索的误差和失败。
而音乐识别,也即基于内容的音乐检索,与基于文本的音乐检索不同,它并非根据音乐的文本信息,而是直接根据音乐样本片段的本身内容,进行识别,从而达到检索的目的。音乐本身虽然具有复杂的物理特性,但是每首音乐均有其相对稳定的特征,并且能够使用这些稳定的特征来表征一段音乐。而音乐识别也就是根据这些音乐的特征来完成识别。能够从音乐中提取出的特征有许多,例如每分钟节拍数、开始结束时间节点等,使用不同的理论和方法,可以提取到不同的音频特征。而不同的音频特征具有不同的特性,针对不同的条件,可以选取适当的特征进行识别。音乐识别克服了基于文本的音乐检索的局限性,关注音乐本身,具有更好的适应性和实用性,也将逐渐成为音乐检索的主流趋势。
音乐识别,作为声音及音乐计算中较为基础和实用的课题,在国内外均得到了重视。Shazam公司的音乐识别服务是通过提取乐纹(Music-Fingerprinting,MFP),然后进行匹配来实现音乐识别的,它提出了一种基于特征点的乐纹提取方法,即从频谱中找到特征点,将其组成特征点对(Peak-Pairs),由特征点对组成的序列就是该片段的乐纹。另有一种基于隐马尔可夫模型的古典音乐自动识别系统,该系统根据提取出的半阶音符类特征(Chroma Features)进行聚类,然后利用隐马尔可夫模型进行识别。
以Shazam公司成果为基础的一种优化的海量音乐检索系统,通过在乐纹提取过程中加入频谱优化、峰值过滤、设定特征点置信度三个环节来实现对乐纹的优化。还有使用线性对齐匹配法用以实现近似旋律匹配并以此为基础构建的哼唱检索系统。该方法主要根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑而形成的新方法。
但上述音乐识别方法对音乐的识别率并不高,识别效果也并不理想,有待进一步改进。
发明内容
本发明的目的是提供一种具有更好的抗噪性和识别率,识别效果更加理想的音乐识别方法及系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710077359.2/2.html,转载请声明来源钻瓜专利网。