[发明专利]一种歌曲情感检测的方法在审
申请号: | 202011457089.6 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112614511A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 孙伟芳;朱立松;黄建杰 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L21/0272 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214000 江苏省无锡市新区震泽路1*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 歌曲 情感 检测 方法 | ||
本发明涉及多媒体信息处理技术领域,具体涉及一种歌曲情感检测的方法,其技术要点在于:包含以下步骤:将唱歌声音与乐曲进行分离;根据歌声原曲分为m个片段;对唱歌声音进行情感标签预测,并根据情感标签落在不同象限的次数计数将预测结果表现为一个矩阵A1,A1中取值最大的象限代表这首歌的感情象限;如果有两个以上取值最大的且相等的象限,对乐曲片段和歌词分别预测,根据V‑A的取值也将预测结果落在不同象限的次数计数表现为一个矩阵A2,A1+A2中最大值对应的象限代表这首歌的感情象限,若还有2个以上相等值,则这首歌对应2个以上的感情象限。从三个方面分析歌曲情感,通过标签模型和维度模型两种情感标签表现,使得分析得的结果更加全面、准确。
技术领域
本发明涉及多媒体信息处理技术领域,具体涉及一种歌曲情感检测的方法。
背景技术
音乐是人类表达情感的一种方式,音乐于情感有着非常密切的联系。音乐情感的传达和表达跟音乐的理解、创作、欣赏者创作者的知识储备以及情感经历等等都有关。多媒体与人工智能多方位的结合已经是当前科研领域的一大热点,音乐情感识别也在这样的背景下掀起了一大研究热潮。
但是,现有技术中,自动识别音乐情感存在着诸多困难,情感是非常主观的东西,在不同的人之间存在较大的差异,并且很难将其量化。对于歌曲的情感检测同样不是容易的事情,除了情感与歌曲的很多特征相关联之外,音乐所表达的情感与歌词所表达的情感并不总是匹配。而且,一首歌的情感会随着音乐的播放不断变化。在音乐情感识别领域,没有一个统一的情感表征方法,也就是说,对于使用哪种标签,用多少标签,以及情感应该被视为范畴性的还是连续连的,大家并没有达成共识。多年来,根据研究和实验方式和角度不同,情感注释一直以不同的方式体现。因此,研究人员开发了许多不同的结果可视化的方法,很难精确描述这些可视化研究的最新进展。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中歌曲情感检测不全面的缺陷,从而提供一种歌曲情感检测的方法。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种歌曲情感检测的方法,其特征在于:包含以下步骤:
S1:将唱歌声音与乐曲进行分离;
S2:根据歌声原曲将乐曲、唱歌声音和歌词按照唱歌声音断点,分为m个片段;
S3:对每个片段唱歌声音进行情感标签预测,并根据每个片段的情感标签落在不同象限的次数计数将预测结果表现为一个矩阵A1,A1中取值最大的象限代表这首歌所对应的感情象限;如果有两个以上取值最大的且相等的象限,对乐曲片段进行arousal预测,对歌词片段进行valence预测,并且根据V-A的取值也将预测结果落在不同象限的次数计数表现为一个矩阵A2,A1+A2中最大值对应的象限代表这首歌所对应的象限,若还有2个以上相等值,则这首歌对应2个以上的感情象限。
优选的,所述唱歌声音为歌曲原曲中的人声,分离方法为WaveNet技术。
优选的,按照唱歌声音断点停顿时长大于5s进行分段。
优选的,利用机器学习的分类方法或者深度学习将每个片段唱歌声音进行Thayer情感环情感标签预测。
优选的,所述歌词片段的预测包含以下步骤:
A1:对歌词片段进行预处理;
A2:从文学性和心理学两个方面提取歌词的特征。
优选的,所述预处理包括习惯用语、无用词去除及词性标注。
上述所述的的一种歌曲情感检测的方法,将人声、乐曲及歌词进行分离,并从三个方面分析歌曲情感,使得分析得出的结果更加全面,更加准确;同时,通过标签模型和维度模型两种情感标签表现方式,更加具体和全面。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011457089.6/2.html,转载请声明来源钻瓜专利网。