[发明专利]一种音乐节奏检测方法、装置、设备及存储介质在审
申请号: | 202110767209.0 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113643717A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 李治均 | 申请(专利权)人: | 深圳市联洲国际技术有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L25/51 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音乐 节奏 检测 方法 装置 设备 存储 介质 | ||
本发明提供了一种音乐节奏检测方法、装置、设备及存储介质,该方法包括:获取待检测音乐的若干帧音频数据,并将若干帧音频数据转换为频谱数据;对若干帧频谱数据进行分解,获得若干帧音频数据的幅值谱和相位谱;根据前K帧音频数据对应的幅值谱和相位谱,计算当前帧音频数据的预测频谱;根据当前帧音频数据对应的频谱数据、预测频谱数据,计算当前帧音频数据的目标幅值谱;对目标幅值谱进行滤波,得到当前帧音频数据的节奏点。通过结合音频数据的相位信息和幅值信息,能准确检测出由于相位变化导致的节奏点,提高节奏检出率,同时通过滤波计算出节奏周期,可以不依赖幅值与相位大小,准确检测出多变节拍形式下的节奏点。
技术领域
本发明涉及音频数据处理技术领域,尤其涉及一种音乐节奏检测方法、装置、设备及存储介质。
背景技术
音乐节奏检测是音乐信息检索(Music Information Retrieval,MIR)的重要任务之一,其在舞台灯光自动变换、歌曲分类等方面具有极大潜力的应用前景。人类可以轻松的识别出音乐的节奏,然后自然地跟着音乐的节拍脚踏、摇头或拍手。但对计算机来说,理解音乐的节奏和旋律仍然是个具有挑战性的任务。目前主流的音乐节奏检测方法是基于音乐信号频谱能量法进行音乐节奏的检测。现有的基于频谱能量法的检测方法存在两个缺陷:1、忽略了音乐频域相位的变化而仅仅使用频域幅值,无法检测出由于相位变化而引起的节奏点;2、仅基于频谱能量峰值的方法判断节奏点,不能处理现有音乐中多变的节拍形式,如切分音等。
发明内容
针对上述问题,本发明的目的在于提供一种音乐节奏检测方法、装置、设备及存储介质,其能检测出由于相位变化导致的节奏点,提高节奏检出率。
第一方面,本发明实施例提供了一种音乐节奏检测方法,包括:
获取待检测音乐的若干帧音频数据,并将若干帧所述音频数据转换为频谱数据;
对若干帧所述频谱数据进行分解,获得若干帧所述音频数据的幅值谱和相位谱;
根据前K帧音频数据对应的幅值谱和相位谱,计算当前帧音频数据的预测频谱;
根据当前帧音频数据对应的频谱数据、预测频谱数据,计算当前帧音频数据的目标幅值谱;
对所述目标幅值谱进行滤波,得到当前帧音频数据的节奏点。
作为上述方案的改进,所述对所述目标幅值谱进行滤波,得到当前帧音频数据的节奏点,包括:
对所述目标幅值谱进行不同延迟下的滤波处理,得到不同延迟下的滤波结果;
根据不同延迟下的滤波结果,确定出最佳延迟;
根据所述最佳延迟以及所述最佳延迟对应的滤波结果,计算起始节奏点;
以所述最佳延迟为节奏周期,根据所述起始节奏点和所述节奏周期,得到所述节奏点。
作为上述方案的改进,所述根据不同延迟下的滤波结果,确定出最佳延迟,包括:
对不同延迟下的滤波结果进行加和,获取最大加和值对应的延迟作为最佳延迟。
作为上述方案的改进,所述将若干帧所述音频数据转换为频谱数据,包括:
对所述音频数据进行滑窗分帧处理;
对分帧后的音频数据进行傅里叶变换,得到所述频谱数据。
作为上述方案的改进,所述根据前K帧音频数据对应的幅值谱和相位谱,计算当前帧音频数据的预测频谱,包括:
根据前K帧音频数据对应的幅值谱和相位谱,通过公式(1),计算当前帧音频数据的预测频谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市联洲国际技术有限公司,未经深圳市联洲国际技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110767209.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光栅剪切干涉投影物镜波像差检测装置及检测方法
- 下一篇:全自动电动牙刷包装机