[发明专利]基于标签深度分析的音乐自动标注方法在审
申请号: | 201910047030.0 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109918535A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 王振宇;萧永乐;张睿;雷昶;高雨轩 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/68 | 分类号: | G06F16/68;G06F16/65;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 裴磊磊 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐标签 音乐数据 自动标注 深度分析 多层级 音乐 传统音乐 标签 二维卷积 聚合特征 梅尔频谱 数据切片 数据清洗 特征提取 网络构建 向量表示 一维卷积 音频内容 可用性 采样 标注 聚合 工作量 网络 学习 预测 转换 应用 监督 维护 | ||
本发明公开了一种基于标签深度分析的音乐自动标注方法,包括以下步骤:S1、收集音乐数据并结合音乐标签体系进行数据清洗;S2、对音乐数据进行采样,转换为梅尔频谱图并进行数据切片;S3、基于一维卷积网络构建音频多层级特征提取网络,通过有监督学习进行参数预训练;S4、基于二维卷积网络进行音乐标签向量表示学习,获取音乐标签特征;S5、实现音频多层级特征与音乐标签特征的特征聚合;S6、基于聚合特征进行最终的音乐标签预测。本发明克服了传统音乐标注方式不能应用于大规模音乐数据集的困难,根据音频内容对音乐进行自动标注,减少了人工维护音乐标签库的工作量,具有很好的可用性。
技术领域
本发明涉及音乐信息研究领域,具体涉及一种基于标签深度分析的音乐自动标注方法。
背景技术
近年来,数字音乐日益普及,用户在互联网上可访问的音乐数量已超过3000万首。另外,由于用户经常在社交媒体上发布大量原创歌曲、翻唱歌曲和其他多媒体资源,音乐的类型日益多元化。作为一种组织海量音乐数据的有效手段,丰富的音乐标注信息对于在线音乐产品有重要价值。音乐标注信息也为音乐检索、音乐发现服务提供很高的潜在经济价值。基于此,音乐自动标注作为一种有效的音乐信息丰富方法受到越来越多的关注与研究。
深度神经网络已经成功应用于音乐自动标注领域。深度学习通常需要一个规模足够大的训练集,而唯一满足这个要求的只有在线音乐应用下用户标注的音乐数据集。在这些用户生成的标注元数据中,音乐标签不仅用于描述音乐本身属性如乐器、发布日期等,还用于描述用户对音乐特性的主观认识及个人观点。用户对音乐标签的组织方式也有决定性作用,比如用户可以根据个人习惯定义音乐标签结构。例如,某些用户在在线音乐流媒体上输入独特的标签,如用随机的字符序列对音乐进行标注,从而更好地管理个人音乐收藏。这些标签对其他用户没有任何意义,因此这是用户滥用音乐标注服务的一种体现。虽然这种性质的标签很容易通过启发式方法识别及去除,但用户标注数据集中其他问题并不容易解决。这些问题包括错误标注,过度使用如流派或情感类别等主观标签,以及标签分类体系异构等问题。这些问题是造成数据集中存在标签噪声的重要原因,数据集标签噪声会导致深度神经网络的学习效果较差。
发明内容
本发明的目的是针对现有技术的不足,提供了一种基于标签深度分析的音乐自动标注方法。
本发明的目的可以通过如下技术方案实现:
一种基于标签深度分析的音乐自动标注方法,所述方法包括以下步骤:
S1、收集音乐数据并结合音乐标签体系进行数据清洗;
S2、对音乐数据进行采样,转换为梅尔频谱图并进行数据切片;
S3、基于一维卷积网络构建音频多层级特征提取网络,通过有监督学习进行参数预训练;
S4、基于二维卷积网络进行音乐标签向量表示学习,获取音乐标签特征;
S5、实现音频多层级特征与音乐标签特征的特征聚合;
S6、基于聚合特征进行最终的音乐标签预测。
进一步地,所述步骤S1具体包括以下步骤:
S11、从自有曲库和互联网音乐平台收集音乐音频和音乐标签数据;
S12、根据音乐标签体系对音乐标签进行清洗、规范化,过滤掉缺少标签标注的音乐数据。
进一步地,所述步骤S2具体包括以下步骤:
S21、将音乐音频数据转换为mp3格式,按照16kHz采样频率进行采样或重采样;
S22、对采样音频进行梅尔频谱图转换;
S23、对梅尔频谱进行对数处理,根据固定音频帧窗口大小重复随机采样,再对每个切片进行标准化和归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910047030.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型电台软件
- 下一篇:播放歌曲高潮的方法、装置、设备及存储介质