[发明专利]一种基于深度学习的音乐情感可信分类方法有效
申请号: | 202010194842.0 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111462774B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 李景仙;韩立新;李晓双;彭国争 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/63;G10L25/27 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 音乐 情感 可信 分类 方法 | ||
本发明公开了一种基于深度学习的音乐情感可信分类方法,构建音乐情感可信数据集,在此基础上将音乐样本切片转换并构建音乐情感声谱图数据集,通过深度学习网络ResNet50训练学习音乐情感特征,并采用分类准确度高于75%的网络模型预测新音乐样本的情感类型,根据不同时间序列音乐片段影响度不同,分配不同的情感可信度,最后通过音乐情感分类预测值与可信度融合进行可信计算并确定其情感类型。本发明采用声谱图获取音乐情感信息,通过深度学习网络ResNet50进行训练学习,同时结合时间序列可信度进行可信计算,能够获取音乐情感细节信息,能够提高音乐情感分类速度和准确率,同时提高音乐情感分类的可信度。
技术领域
本发明涉及深度学习及信息处理技术领域,具体涉及一种基于深度学习的音乐情感可信分类方法。
背景技术
随着多媒体技术和互联网技术的发展,人们对娱乐方式的需求逐渐增加,听音乐成为其中一种重要的娱乐方式,音乐可以表达人们的情感,调整人们的心理状态,因此,提供满足用户情感需求的音乐变得尤为重要,但是,寻找符合用户当下听歌状态和听歌心情的音乐并非易事,目前,很多音乐网站音乐分类都是基于流派的分类或场景的分类,基于流派的分类主要有:流行,摇滚,乡村等,主要满足人们对不同流派类型的喜好;基于场景的分类主要有学习场景、工作场景、运动场景等,满足人们在不同环境下氛围的需求。然而这些分类都忽略了人们情感需求,部分音乐网站提供音乐情感的分类,如网易云音乐,虾米音乐,QQ音乐,而这些网站的情感标签多是上传用户的主观标注,同一首歌经常出现在不同的情感类型中,缺乏一定的客观性,可信度较低。
传统的情感分类方法主要从音频中采样部分特征进行分类,如过零率(ZeroCrossing Rate),短时能量(Energy),梅尔频率倒谱系数(MFCC)等,人工手动对音频特征进行信息提取,这种方式分类速度慢,准确率低。声谱图是频谱分析图,采用二维平面表达三维信息,声谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量值,能够反映出音乐随时间变化带来的频率变化及声音能量变化情况,能够反映出不同情感状态下的能量信息,声谱图已经成为音乐分类的重要依据。
深度学习已经成为当下研究热点,深度学习能够学习样本数据的内在规律和表示层次,能够让机器像人一样具有分析学习能力,能够识别文字、图像和声音等数据,因此在计算机视觉、图像处理和自然语言处理领域有广泛的应用,深度学习算法中卷积神经网络能够自动提取图像特征并进行分析学习,提高分类准确率和效率,在图像分类中有较高的应用价值。
残差网络ResNet是2015年由何凯明,张翔宇,任少卿,孙剑四位学者提出的卷积神经网络结构,能够通过增加深度提高准确率,同时采用残差块进行跳跃连接构建网络结构,能够解决梯度消失和网络退化问题,使用残差网络ResNet50进行音乐情感分类,能够获取全面的音乐情感信息,分析音乐情感特征,提高分类的准确率,同时,残差网络ResNet50能够进行大规模数据集的训练学习,提高分类的效率,保存的网络模型能够测试新的样本数据,提高分类预测的准确率。
可信度是对一个事物或事物为真的相信程度,指的是测量结果的一致性。可信分类指的是在同样或类似的条件下重复实验,仍然得到同样的分类结果,保证分类准确率的稳定性,音乐情感可信分类能够提高人们对情感类型的信任度,保证情感分类结果的一致性。
发明内容
发明目的:传统的音乐情感分类研究中,通常采用人工手动提取部分音频特征进行分类,采样速度慢,特征信息片面,准确率低,可信度低,针对以上问题,本发明提出了一种基于深度学习的音乐情感可信分类方法,采用声谱图获取音乐情感信息,通过深度学习网络ResNet50进行训练学习,同时结合时间序列可信度进行可信计算,能够提高音乐情感分类速度和准确率,同时提高音乐情感分类的可信度。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于深度学习的音乐情感可信分类方法,步骤如下:
步骤一:收集音乐样本,根据音乐平台情感歌单和人工筛选验证确定k种音乐情感类型,构建音乐情感可信分类数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194842.0/2.html,转载请声明来源钻瓜专利网。