[发明专利]一种音频处理方法及装置有效
申请号: | 201410566673.3 | 申请日: | 2014-10-22 |
公开(公告)号: | CN104978973B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 赵伟峰 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 | ||
本发明实施例提供一种音频处理方法及装置,其中的方法可包括:获取待处理的音频文件及所述音频文件对应的字幕文件;解析所述字幕文件,获得至少一个时间段,一个时间段用于描述所述字幕文件中的一个字符的播放时间;按照所述至少一个时间段对所述音频文件进行划分处理,获得至少一个音频数据,一个时间段对应一个音频数据;分析所述至少一个音频数据的音准信息;根据所述至少一个时间段及所述至少一个音频数据的音准信息,生成所述音频文件对应的MIDI文件。本发明可以自动化生成音频文件对应的MIDI文件,提升音频处理的效率,提升音频处理的智能性。
技术领域
本发明涉及互联网技术领域,尤其涉及音频技术领域,具体涉及一种音频处理方法及装置。
背景技术
MIDI(Musical Instrument Digtal Interface,乐器数字接口)是一个工业标准的电子通信协议,MIDI传输诸如音符、控制参数等非声音信号的指令,用于指示MIDI设备的操作以及控制MIDI设备之间的交互。MIDI文件通常是以.mid为结尾的指令文件,这些指令可以包括某个音符的开始时间、结束时间、代表音符的音调特征的特征值等信息。音频文件对应的MIDI文件可以作为该音频文件的音准参考文件,当用户对音频文件进行重新演绎时,可以采用该音频文件对应的MIDI文件对重新演绎的内容进行音准比对,并可用于对重新演绎的内容进行评分。现有技术中音频文件对应的MIDI文件通常是由诸如音频文件的作曲者等音频制作人制作生成,人工制作需要消耗大量人力资源和时间效率,从而降低了音频处理的效率和智能性。
发明内容
本发明实施例提供一种音频处理方法及装置,可以自动化生成音频文件对应的MIDI文件,提升音频处理的效率,提升音频处理的智能性。
本发明实施例第一方面提供了一种音频处理方法,可包括:
获取待处理的音频文件及所述音频文件对应的字幕文件;
解析所述字幕文件,获得至少一个时间段,一个时间段用于描述所述字幕文件中的一个字符的播放时间;
按照所述至少一个时间段对所述音频文件进行划分处理,获得至少一个音频数据,一个时间段对应一个音频数据;
分析所述至少一个音频数据的音准信息;
根据所述至少一个时间段及所述至少一个音频数据的音准信息,生成所述音频文件对应的MIDI文件。
本发明实施例第二方面提供一种音频处理装置,可包括:
文件获取单元,用于获取待处理的音频文件及所述音频文件对应的字幕文件;
字幕解析单元,用于解析所述字幕文件,获得至少一个时间段,一个时间段用于描述所述字幕文件中的一个字符的播放时间;
音频解析单元,用于按照所述至少一个时间段对所述音频文件进行划分处理,获得至少一个音频数据,一个时间段对应一个音频数据;
音准分析单元,用于分析所述至少一个音频数据的音准信息;
文件生成单元,用于根据所述至少一个时间段及所述至少一个音频数据的音准信息,生成所述音频文件对应的MIDI文件。
实施本发明实施例,具有如下有益效果:
本发明实施例中,通过对音频文件以及音频文件对应的字幕文件进行解析,获得至少一个时间段和至少一个音频数据,通过对所述至少一个音频数据进行音准信息的分析,并结合至少一个时间段生成所述音频文件对应的MIDI文件;由于无需人工制作MIDI文件,有效地节省了音频处理所消耗的人力资源和时间资源,提升音频处理的效率,提升音频处理的智能性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410566673.3/2.html,转载请声明来源钻瓜专利网。