[发明专利]检测音频的中频节奏点的方法、装置、设备和存储介质有效
申请号: | 201911363707.8 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111105769B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 劳振锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10H1/40 | 分类号: | G10H1/40;G10L25/87 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭新禹 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 音频 中频 节奏 方法 装置 设备 存储 介质 | ||
本申请公开了一种检测音频的中频节奏点的方法、装置、设备和存储介质,属于音频处理技术领域。所述方法包括:确定音频的拍型、音乐小节和节奏点;基于所述音频的拍型,在每个音乐小节中确定中频节奏点对应的第一目标时间范围;对于每个音乐小节,如果在所述音乐小节的第一目标时间范围内检测出满足中频能量特征条件的节奏点,且在包含所述音乐小节的起始时间点的第二目标时间范围内检测出满足低频能量特征条件的节奏点,则将所述满足中频能量特征条件的节奏点确定为所述音频的中频节奏点。采用本申请提供的方法,可以有效解决相关技术中检测出的中频节奏点的准确率较低的技术问题。
技术领域
本申请涉及音频处理技术领域,具体涉及一种检测音频的中频节奏点的方法、装置、设备和存储介质。
背景技术
在使用手机外放播放歌曲时,由于手机外放低频往往不足,所以歌曲的低频节奏点(也可以称为低频鼓点,在低频节奏点存在击打底鼓发出的声音)往往感知不明显,感知明显的往往是中频节奏点(也可以称为中频鼓点,在中频节奏点存在击打军鼓或嗵鼓发出的声音)。
由于中频节奏点感知较为明显,所以往往将歌曲的中频节奏点提取出来,做一些有趣的应用。例如,在手机上播放歌曲的过程中,可以在中频节奏点进行播放背景的切换,以提高歌曲播放时的节奏感。
相关技术中在检测歌曲的节奏点时,通过检测歌曲在各个时间点的能量来确定歌曲的中频节奏点。但是,由于在歌曲中还存在除鼓声之外的其余声音(如人声),所以检测中频节奏点时很容易受到其余声音的干扰,使得检测出的中频节奏点的准确率较低。
发明内容
本申请实施例提供了一种检测音频的中频节奏点的方法、装置、设备和存储介质,可以解决相关技术中存在的技术问题。所述检测音频的中频节奏点的方法、装置、设备和存储介质的技术方案如下:
第一方面,提供了一种检测音频的中频节奏点的方法,所述方法包括:
确定音频的拍型、音乐小节和节奏点;
基于所述音频的拍型,在每个音乐小节中确定中频节奏点对应的第一目标时间范围;
对于每个音乐小节,如果在所述音乐小节的第一目标时间范围内检测出满足中频能量特征条件的节奏点,且在包含所述音乐小节的起始时间点的第二目标时间范围内检测出满足低频能量特征条件的节奏点,则将所述满足中频能量特征条件的节奏点确定为所述音频的中频节奏点;
其中,所述满足低频能量特征条件的节奏点是指所述音频在所述节奏点的能量满足低频能量特征,所述满足中频能量特征条件的节奏点是指所述音频在所述节奏点的能量满足中频能量特征。
在一种可能的实现方式中,确定音频的音乐小节,包括:
基于madmom中的beat算法或downbeat算法,确定所述音频的音乐小节。
在一种可能的实现方式中,确定音频的节奏点,包括:
基于madmom中的onset算法或superflux算法,确定所述音频的所有节奏点。
在一种可能的实现方式中,所述基于所述音频的拍型,在每个音乐小节中确定中频节奏点对应的第一目标时间范围,包括:
如果所述音频的拍型为42拍或86拍,则在每个音乐小节中确定包含所述音乐小节的中间时间点的第一目标时间范围;
如果所述音频的拍型为44拍,则在每个音乐小节中确定包含所述音乐小节的1/4时间点的第一目标时间范围,以及包含所述音乐小节的3/4时间点的第一目标时间范围;
如果所述音频的拍型为43拍,则在每个音乐小节中确定包含所述音乐小节的1/3时间点的第一目标时间范围,以及包含所述音乐小节的2/3时间点的第一目标时间范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911363707.8/2.html,转载请声明来源钻瓜专利网。