[发明专利]一种音频处理方法及装置有效

申请号：	201410566673.3	申请日：	2014-10-22
公开（公告）号：	CN104978973B	公开（公告）日：	2019-08-13
发明（设计）人：	赵伟峰	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	G10L25/48	分类号：	G10L25/48
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;熊永强
地址：	510000 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音频处理方法，其特征在于，包括：

获取待处理的音频文件及所述音频文件对应的字幕文件；

解析从所述字幕文件，获得至少一个时间段，其中，一个时间段用于描述所述字幕文件中的一个字符的播放时间；

按照所述至少一个时间段对所述音频文件进行划分处理，获得至少一个音频数据，一个时间段对应一个音频数据；

分析所述至少一个音频数据的音准信息；

根据所述至少一个时间段及所述至少一个音频数据的音准信息，生成所述音频文件对应的乐器数字接口MIDI文件。

2.如权利要求1所述的方法，其特征在于，所述解析从所述字幕文件，获得至少一个时间段，包括：

解析所述字幕文件，获得所述字幕文件包括的至少一个字符中各字符的时间属性描述文本；

按照各字符在所述字幕文件中的播放顺序，依次从各字符的时间属性描述文本读取各字符的播放时间，获得至少一个时间段。

3.如权利要求1所述的方法，其特征在于，所述按照所述至少一个时间段对所述音频文件进行划分处理，获得至少一个音频数据，包括：

按照所述至少一个时间段对所述音频文件进行划分处理，获得与各时间段对应的音频片段；

分别提取各时间段对应的音频片段中的音频数据，获得至少一个音频数据。

4.如权利要求1-3任一项所述的方法，其特征在于，所述分析所述至少一个音频数据的音准信息，包括：

依次从所述至少一个音频数据中选取一个音频数据确定为目标音频数据；

按照预设时间长度对所述目标音频数据进行分帧处理，获得至少一帧音频帧；

计算所述目标音频数据的各音频帧的频谱重心；

根据所述目标音频数据的各音频帧的频谱重心，计算所述目标音频数据的频谱均值；

对所述目标音频数据的频谱均值进行归一化处理，获得用于描述所述目标音频数据的音准信息的MIDI值。

5.如权利要求4所述的方法，其特征在于，所述计算所述目标音频数据的各音频帧的频谱重心，包括：

依次从所述目标音频数据的至少一帧音频帧选取一帧音频帧确定为目标音频帧；

采用傅里叶变换算法对所述目标音频帧进行变换处理；

对变换处理后的目标音频帧进行求模运算，获得参考数据；

按照所述预设时间长度对所述参考数据进行归整处理；

从归整处理后的参数数据中选取计算因子；

采用频谱重心算法对所述计算因子进行运算，获得所述目标音频帧的频谱重心。

6.如权利要求4所述的方法，其特征在于，所述根据所述至少一个时间段及所述至少一个音频数据的音准信息，生成所述音频文件对应的MIDI文件，包括：

将所述至少一个音频数据的MIDI值确定为至少一个音符的特征值；

将所述至少一个时间段确定为所述至少一个音符的时间属性；

按照所述至少一个时间段的先后顺序，将所述至少一个音符、所述至少一个音符的特征值及所述至少一个音符的时间属性构建为所述音频文件对应的MIDI文件。

7.一种音频处理装置，其特征在于，包括：

文件获取单元，用于获取待处理的音频文件及所述音频文件对应的字幕文件；

字幕解析单元，用于解析所述字幕文件，获得至少一个时间段，一个时间段用于描述所述字幕文件中的一个字符的播放时间；

音频解析单元，用于按照所述至少一个时间段对所述音频文件进行划分处理，获得至少一个音频数据，一个时间段对应一个音频数据；

音准分析单元，用于分析所述至少一个音频数据的音准信息；

文件生成单元，用于根据所述至少一个时间段及所述至少一个音频数据的音准信息，生成所述音频文件对应的MIDI文件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司，未经广州酷狗计算机科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410566673.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载