[发明专利]歌词转换点检测方法、装置、计算机设备及存储介质有效

申请号：	202110775920.0	申请日：	2021-07-09
公开（公告）号：	CN113516971B	公开（公告）日：	2023-09-29
发明（设计）人：	萧博耀;高旋	申请（专利权）人：	深圳万兴软件有限公司
主分类号：	G10L15/04	分类号：	G10L15/04;G10L25/81
代理公司：	深圳市精英专利事务所 44242	代理人：	武志峰
地址：	518000 广东省深圳市南***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	歌词转换检测方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种歌词转换点检测方法、装置、计算机设备及存储介质，涉及音频处理技术领域。其中方法包括：获取目标音频数据；对目标音频数据进行检测以得到目标音频数据的节拍；对目标音频数据进行人声分离处理以得到人声数据；计算人声数据的幅值以得到人声能量波形；对人声能量波形进行预处理以得到目标波形；根据目标音频数据的节拍以及预设转换条件对目标波形进行检测以确定歌词的转换点。该方法实现了机器设备对音乐和人声的有效识别，并通过目标音频数据的节拍以及预设转换条件来检测经过处理后的人声数据实现精准地确定歌词的转换点，大大提高了对歌词转换点定位的精度以及效率。

技术领域

本发明涉及音频处理技术领域，尤其涉及一种歌词转换点检测方法、装置、计算机设备及存储介质。

背景技术

卡点视频是一种近年来新兴起的音视频编辑软件功能，主要作法是让使用者自行添加动态和静态影像，并且选择一段音乐，软件就自动生成一段音视频，其中视频部份的转场或渲染时间点和抉择的音乐有特定设计过的关联性，例如会出现在音乐的鼓点、重拍点以及特效点上，使得自动生成产出的音视频能够看起来不冲突，如同使用者花上很多时间精心编辑之后的结果。

基于卡点视频的需求，可归纳常用的音乐视频剪辑成果，由此可发现除了音乐的重拍和鼓点等传统特征点之外，歌词转换点(一首歌里面间奏结束，人声开始唱歌的那个时间点)也非常适合作为转场或渲染时间的点。

但是检测音乐中的人声一直以来都是MIR(Music Information Retrieval，音乐信息检索)领域中一项难度很大，并具有挑战性的问题。歌曲中的内容包括音乐和人声两部分，它们之间的频谱相互重叠，互相影响。虽然人耳能很清晰的分辨出含人声的音乐，但是对于计算机等机器设备来说，还不能够有效识别出音乐和人声。现有技术中主要通过人工的方式对歌词转换点进行定位，该种方式的定位精度以及效率较低。

发明内容

本发明实施例提供了一种歌词转换点检测方法、装置、计算机设备及存储介质，旨在解决现有人工的方式对歌词转换点进行定位的精度以及效率较低的问题。

第一方面，本发明实施例提供了一种歌词转换点检测方法，所述歌词转换点检测方法包括：

获取目标音频数据；对所述目标音频数据进行检测以得到所述目标音频数据的节拍；对所述目标音频数据进行人声分离处理以得到人声数据；计算所述人声数据的幅值以得到人声能量波形；对所述人声能量波形进行预处理以得到目标波形；根据所述目标音频数据的节拍以及预设转换条件对所述目标波形进行检测以确定歌词的转换点。

第二方面，本发明实施例还提供了一种歌词转换点检测装置，该装置包括：

获取单元，用于获取目标音频数据；

检测单元，用于对所述目标音频数据进行检测以得到所述目标音频数据的节拍；

分离单元，用于对所述目标音频数据进行人声分离处理以得到人声数据；

计算单元，用于计算所述人声数据的幅值以得到人声能量波形；

预处理单元，用于对所述人声能量波形进行预处理以得到目标波形；

确定单元，用于根据所述目标音频数据的节拍以及预设转换条件对所述目标波形进行检测以确定歌词的转换点。

第三方面，本发明实施例还提供了一种计算机设备，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行上述计算机程序时实现上述方法。