[发明专利]一种音乐结构的确定方法、装置、设备及介质在审
申请号: | 202010783244.7 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112037764A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张凯翔;朱一闻;曹偲;郑博 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/05;G10L15/065;G10L15/08;G06F16/61;G06F16/65;G06F16/683;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王娜 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音乐 结构 确定 方法 装置 设备 介质 | ||
本发明实施例提供一种音乐结构的确定方法、装置、设备及介质,用以提高确定出的音乐结构的准确性。所述音乐结构的确定方法,包括:获取待检测音乐的音频内容和歌词内容;对所述音频内容进行分析,确定所述音频内容的边界分割信息;对所述歌词内容进行分析,确定所述歌词内容的边界分割时间信息;对所述边界分割信息和所述边界分割时间信息进行融合,得到融合边界信息;对所述融合边界信息进行聚类,确定所述待检测音乐中每个段落的段落类别以及所述待检测音乐的结构。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种音乐结构的确定方法、装置、设备及介质。
背景技术
流行歌曲一般来说结构简单,形式活泼,易于传唱。从作曲和编曲的角度,流行歌曲通常包含以下几个部分:主歌、副歌、桥段。主歌可以说是内容,是每首音乐的主干,副歌是指内容区别于主歌、发展与概括性比较强的且在节奏情感曲调上与主歌形成对比的段落。副歌是歌曲感情最强烈抒发的部分,乐器使用多且音量较大、饱满,概括性很强,并且对于每一首流行歌曲,其副歌都具有至少2次的旋律重复,因此它通常是每首流行歌曲中最先为听众熟知的部分。
随着数字音乐行业的发展,音乐内容大量增长,越来越多的用户喜欢直接试听副歌,来选择自己喜欢的歌曲,或者将歌曲的副歌截取出来作为手机铃声或背景音。因此,如果能够准确确定音乐的结构,并直接将歌曲的副歌位置检测出来展现给用户,无疑会给用户带来很大的便利。
发明内容
本发明实施例提供一种音乐结构的确定方法、装置、设备及介质,用以提高确定出的音乐结构的准确性。
第一方面,本发明实施例提供一种音乐结构的确定方法,该方法包括:
获取待检测音乐的音频内容和歌词内容;
对音频内容进行分析,确定音频内容的边界分割信息;
对歌词内容进行分析,确定歌词内容的边界分割时间信息;
对边界分割信息和边界分割时间信息进行融合,得到融合边界信息;
对融合边界信息进行聚类,确定待检测音乐中每个段落的段落类别以及待检测音乐的结构。
本发明实施例提供的音乐结构的确定方法,获取待检测音乐的音频内容和歌词内容之后,首先对音频内容进行分析,确定音频内容的边界分割信息,然后对歌词内容进行分析,确定歌词内容的边界分割时间信息,然后在边界分割信息的基础上,融合边界分割时间信息,得到融合边界信息,并基于融合边界信息,确定待检测音乐的结构,使得音乐结构位置的确定结果更加精准。
在一种可能的实施方式中,本发明实施例提供的上述方法中,对音频内容进行分析,确定音频内容的边界分割信息,包括:
对音频内容进行常Q变换谐波转换离散(Constant Q Transform,CQT)变换,得到音频内容的CQT特征;
提取音频内容的梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)特征;
基于CQT特征和MFCC特征确定音频内容的音频特征图;
计算音频特征图的拉普拉斯矩阵,并对拉普拉斯矩阵进行奇异值分解,得到分解结果;
对分解结果进行聚类,得到音频内容的第一类边界分割信息。
在一种可能的实施方式中,本发明实施例提供的上述方法中,对音频内容进行分析,确定音频内容的边界分割信息,包括:
提取音频内容的音级轮廓(Pitch Class Profiles,PCP)特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010783244.7/2.html,转载请声明来源钻瓜专利网。