[发明专利]音频处理方法、装置及存储介质有效

申请号：	201811404900.7	申请日：	2018-11-23
公开（公告）号：	CN109346044B	公开（公告）日：	2023-06-23
发明（设计）人：	万景轩;肖纯智	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	G10H1/00	分类号：	G10H1/00;G10H1/40
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	鞠永善
地址：	510660 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频处理方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种音频处理方法、装置及存储介质，属于多媒体技术领域。所述方法包括：确定待混音的音频的结构特征，结构特征用于指示音频包括的多个不同性质的第一音频片段，从音频素材库中，获取属于预设混音风格的目标音频素材，以及目标音频素材对应的片段性质和混音信息；基于结构特征、目标音频素材对应的片段性质和混音信息，从多个第一音频片段中确定目标音频素材对应的音频子片段；将目标音频素材与音频子片段进行混音处理。本发明在不改变音频的结构的基础上，将目标音频素材混入原始的音频中，得到另一种版本的音频，保证了播放器播放混音处理后的音频时显示的歌词与实际播放的音频能够匹配。

技术领域

本发明涉及多媒体技术领域，特别涉及一种音频处理方法、装置及存储介质。

背景技术

随着多媒体技术的快速发展，混音逐渐成为一种主流。混音是指通过改变音频的强弱、音高、音速、曲调长度以及其他各方面构成音频要素的方式，使得音频成为另一种版本，从而为用户提供新鲜的体验。

在相关技术中，混音的处理过程一般可以包括：从音频中提取人声，并选取部分片段，譬如，选取主歌、副歌等片段，然后对选取的片段重新进行排序，为排序后的人声添加一个新的伴奏，从而达到混音的目的。

然而，在上述实现方式中，由于对选取的片段重新进行排序，改变了音频原本的结构，从而导致播放器播放混音后的音频时，显示的歌词与实际播放的音频可能不匹配。

发明内容

本发明实施例提供了一种音频处理方法、装置及存储介质，可以解决相关技术导致播放器播放混音后的音频时显示的歌词与实际播放的音频可能不匹配的问题。所述技术方案如下：

第一方面，提供了一种音频处理方法，所述方法包括：

确定待混音的音频的结构特征，所述结构特征用于指示所述音频包括的多个不同性质的第一音频片段；

从音频素材库中，获取属于预设混音风格的目标音频素材，以及所述目标音频素材对应的片段性质和混音信息；

基于所述结构特征、所述目标音频素材对应的片段性质和混音信息，从多个第一音频片段中确定所述目标音频素材对应的音频子片段；