[发明专利]音频处理方法、装置及存储介质有效
申请号: | 201811404900.7 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109346044B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 万景轩;肖纯智 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G10H1/40 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 鞠永善 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 存储 介质 | ||
本发明公开了一种音频处理方法、装置及存储介质,属于多媒体技术领域。所述方法包括:确定待混音的音频的结构特征,结构特征用于指示音频包括的多个不同性质的第一音频片段,从音频素材库中,获取属于预设混音风格的目标音频素材,以及目标音频素材对应的片段性质和混音信息;基于结构特征、目标音频素材对应的片段性质和混音信息,从多个第一音频片段中确定目标音频素材对应的音频子片段;将目标音频素材与音频子片段进行混音处理。本发明在不改变音频的结构的基础上,将目标音频素材混入原始的音频中,得到另一种版本的音频,保证了播放器播放混音处理后的音频时显示的歌词与实际播放的音频能够匹配。
技术领域
本发明涉及多媒体技术领域,特别涉及一种音频处理方法、装置及存储介质。
背景技术
随着多媒体技术的快速发展,混音逐渐成为一种主流。混音是指通过改变音频的强弱、音高、音速、曲调长度以及其他各方面构成音频要素的方式,使得音频成为另一种版本,从而为用户提供新鲜的体验。
在相关技术中,混音的处理过程一般可以包括:从音频中提取人声,并选取部分片段,譬如,选取主歌、副歌等片段,然后对选取的片段重新进行排序,为排序后的人声添加一个新的伴奏,从而达到混音的目的。
然而,在上述实现方式中,由于对选取的片段重新进行排序,改变了音频原本的结构,从而导致播放器播放混音后的音频时,显示的歌词与实际播放的音频可能不匹配。
发明内容
本发明实施例提供了一种音频处理方法、装置及存储介质,可以解决相关技术导致播放器播放混音后的音频时显示的歌词与实际播放的音频可能不匹配的问题。所述技术方案如下:
第一方面,提供了一种音频处理方法,所述方法包括:
确定待混音的音频的结构特征,所述结构特征用于指示所述音频包括的多个不同性质的第一音频片段;
从音频素材库中,获取属于预设混音风格的目标音频素材,以及所述目标音频素材对应的片段性质和混音信息;
基于所述结构特征、所述目标音频素材对应的片段性质和混音信息,从多个第一音频片段中确定所述目标音频素材对应的音频子片段;
将所述目标音频素材与所述音频子片段进行混音处理。
可选地,所述基于所述结构特征、所述目标音频素材对应的片段性质和混音信息,从多个第一音频片段中确定所述目标音频素材对应的音频子片段,包括:
基于所述结构特征,从所述多个第一音频片段中确定性质为所述目标音频素材对应的片段性质的第二音频片段;
基于所述混音信息,确定混音长度,以及从所述第二音频片段中确定混音起始位置;
将所述第二音频片段中从所述混音起始位置开始的所述混音长度的音频子片段确定为所述目标音频素材对应的音频子片段。
可选地,所述将所述目标音频素材与所述音频子片段进行混音处理,包括:
确定所述第二音频片段包括的节拍数量;
基于所述混音信息和所述第二音频片段包括的节拍数量,对所述目标音频素材进行循环拼接,得到混音素材;
将所述混音素材与所述音频子片段进行混音处理。
可选地,基于所述混音信息和所述第二音频片段包括的节拍数量,对所述目标音频素材进行循环拼接,包括:
当所述混音信息还包括预设节拍数量时,如果所述第二音频片段包括的节拍数量与所述片段节拍数量呈倍数关系,则将所述目标音频素材循环拼接成所述混音长度个节拍。
可选地,所述将所述混音素材与所述音频子片段进行混音处理之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811404900.7/2.html,转载请声明来源钻瓜专利网。