[发明专利]一种音频处理方法及装置有效
申请号: | 201310482804.5 | 申请日: | 2013-10-15 |
公开(公告)号: | CN104091595B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 赵伟峰;李深远 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02;G10L15/04;G10L25/90 |
代理公司: | 广州三环专利代理有限公司44202 | 代理人: | 郝传鑫,熊永强 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 | ||
技术领域
本发明涉及互联网技术领域,具体涉及音频处理技术领域,尤其涉及一种音频处理方法及装置。
背景技术
副歌,通常指音频文件(如歌曲、音乐等等)的高潮部分。以歌曲为例,一首歌曲通常采用AA’BA’Form(音乐结构),A代表主歌,而B代表副歌;也即时说,通常一首歌曲由“前奏+两段主歌+一段副歌+过门音乐+一段副歌+一段主歌+结尾音乐”按顺序连接构成。副歌定位对音频文件的分析和处理起着重要作用,因此,如何在音频文件中进行副歌定位,成为音频处理领域的一个亟待解决的重要问题。
发明内容
本发明实施例提供一种音频处理方法及装置,可以对音频文件进行副歌定位,提升音频处理的智能性。
本发明第一方面提供一种音频处理方法,可包括:
从待处理的音频文件中选取区间音频数据;
构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch(音高)序列;
根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。
本发明第二方面提供一种音频处理装置,可包括:
选取模块,用于从待处理的音频文件中选取区间音频数据;
构建模块,用于构建所述区间音频数据的特征参数序列,所述特征参数序列包括能量序列和Pitch序列;
定位模块,用于根据所述区间音频数据的特征参数序列,定位所述音频文件的副歌。
实施本发明实施例,具有如下有益效果:
本发明实施例可从待处理的音频文件中选取区间音频数据,构建区间音频数据的特征参数序列,以实现音频文件的副歌定位,提升了音频处理的智能性;另外,由于仅需要从音频文件中选取区间音频数据进行音频处理,可有效提升音频处理的效率,进一步提升音频处理的智能性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种音频处理方法的流程图;
图2为本发明实施例提供的图1所示的步骤S101的实施例的流程图;
图3为本发明实施例提供的图1所示的步骤S102的实施例的部分流程图;
图4为本发明实施例提供的图1所示的步骤S102的实施例的另一部分流程图;
图5为本发明实施例提供的图1所示的步骤S103的实施例的流程图;
图6为本发明实施例提供的一种音频处理装置的结构示意图;
图7为本发明实施例提供的选取模块的实施例的结构示意图;
图8为本发明实施例提供的构建模块的实施例的部分结构示意图;
图9为本发明实施例提供的构建模块的实施例的另一部分结构示意图;
图10为本发明实施例提供的预处理单元的实施例的结构示意图;
图11为本发明实施例提供的定位模块的实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,音频文件可以包括但不限于:歌曲、歌曲片段、音乐、音乐片段、演奏乐、演奏乐片段、哼唱歌曲、哼唱歌曲片段等文件。本发明实施例的音频处理方案可以应用于互联网领域的多个场景中,例如:可以应用于对互联网音频库中的音频文件进行分析处理的场景,包括:可应用于主音查找的场景中进行副歌的快速定位和准确提取,也可应用于哼唱搜索的场景中进行副歌的快速定位和准确提取,还可应用于乐曲识别的场景中进行副歌的快速定位和准确提取等等;或者,可以应用于对互联网音频库中的音频文件进行试听的场景,包括:可提供副歌进行在线播放或音乐下载前的试听;或者,可以应用于彩铃下载或试听场景,包括:快速定位和准确提取副歌,将副歌作为彩铃提供给用户进行下载或试听,等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310482804.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于速率调制的IP语音隐写方法
- 下一篇:一种摄像机手柄装置