[发明专利]一种基于卷积循环神经网络的音乐音频分类方法在审
申请号: | 202011038361.7 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112199548A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 王振宇;高雨轩 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 循环 神经网络 音乐 音频 分类 方法 | ||
本发明公开了一种基于卷积循环神经网络的音乐音频分类方法,所述方法包括以下步骤:S1、对音乐的音频进行标注得到音乐标注数据集;S2、对数据集采用音乐数据增强方法对训练数据进行增强;S3、将数据集中音乐的音频信号进行分帧与加窗,通过短时傅里叶变换和梅尔尺度变换得到音频对应的梅尔声谱;S4、构建基于卷积循环神经网络的音乐音频分类模型;S5、将训练数据的梅尔声谱输入到基于卷积循环神经网络的音乐音频分类模型进行迭代训练;S6、输入音乐对应的梅尔声谱,对音乐的标签进行预测。本发明所述的方法能提高网络对声谱特征的提取能力,得到更好的音乐整体特征表示,从而提高音乐音频分类的准确性。
技术领域
本发明涉及音乐分类领域,更具体地,涉及一种基于卷积循环神经网络的音乐音频分类方法。
背景技术
随着多媒体与数字技术的迅猛发展,网上的数字音乐资源越来越多,消费者的音乐消费习惯从实体音乐转向了在线音乐平台。海量的音乐资源和巨大的在线曲库,激发着用户产生各种各样复杂的音乐检索的需求,如用户在某一时刻渴望收听某种流派或具有某种情感的歌曲,此时音乐标签就对音乐检索的质量至关重要。除了音乐检索以外,许多推荐、订阅场景也需要歌曲的类别信息,为用户提供更精准的内容。
目前对音乐类别的标注主要还是通过人工和社会化标注。人工标注对标注者的音乐知识与音乐素养有一定的要求,音乐媒体平台通常聘用音乐专家进行标签标注,虽然能保证音乐标签具有很高的准确性,但是成本也会很高。社会化标注通常指通过开放的方式,允许非专业的普通用户对标签进行标注,通过对标注数据的统计生成最终的音乐标签,但是这些标签存在很多类别标记错误的情况。传统音乐分类方法使用的是手工提取的特征,这些特征往往需要专业软件进行提取,往往不具有普适性,而且传统机器学习算法又难以应对现今海量的音乐数据。基于深度学习方法通过网络自动学习音频特征表示,其中常用卷积神经网络进行声谱特征提取。
现如今,学者们只是将神经网络当作分类器来使用,网络的输入还是一些手工音频特征。如Weninger等人(Weninger F,Eyben F,Schuller B.On-line continuous-timemusic mood regression with deep recurrent neural networks[C]//2014 IEEEInternational Conference on Acoustics,Speech and Signal Processing(ICASSP).IEEE,2014:5412- 5416.)从声谱上以一秒为间隔提取底层特征,以这些底层特征为基础计算回归系数、百分位数等统计特征作为循环神经网络的输入,实验表明基于循环神经网络的模型优于支持向量机与多层感知机;Sigtia等人(Sigtia S,Dixon S.Improved musicfeature learning with deep neural networks[C]//2014 IEEE internationalconference on acoustics,speech and signal processing(ICASSP).IEEE,2014:6959-6963.)首先对频谱进行一些预处理抽取统计特征,然后输入神经网络进行音乐分类,同时测试了不同激活函数与优化算法对分类性能的影响;Arjun等人提出了一种采用流形学习技术的两层神经网络用于音乐流派分类,得出当数据以丰富的特征空间作为表示时,神经网络的分类效果可与经典机器学习模型相当的结论。这些方法仍然依赖于手工选取特征,无法发挥深度神经网络的强大学习能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011038361.7/2.html,转载请声明来源钻瓜专利网。