[发明专利]一种基于金字塔式多分辨率的音频波形绘制方法无效
申请号: | 201010610395.9 | 申请日: | 2010-12-28 |
公开(公告)号: | CN102543126A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 韩秀丽;郑鹏程;刘铁华;见良 | 申请(专利权)人: | 新奥特(北京)视频技术有限公司 |
主分类号: | G11B20/10 | 分类号: | G11B20/10 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 100080 北京市海淀区西草场*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 金字 塔式 分辨率 音频 波形 绘制 方法 | ||
技术领域
本发明涉及音频数据处理领域,具体涉及一种基于金字塔式多分辨率的音频波形绘制方法。
背景技术
音频编辑在电台、电视台以及其它数字化建设中起着重要的作用,是媒体管理系统的重要组成部分。比如在电台和电视台,编辑在对采集的原始素材入库之前,都要进行快速的编辑操作,已达到提取用户感兴趣的内容等目的。如果在编辑原始媒体素材时,能够准确、快速显示对应的音频数据的波形,就可以对音频数据的特征进行快速定位(如静音区等),从而加快了编辑操作的时间。
在音频数据处理领域,目前主要采用以下两种方法进行波形的绘制:
1.无缓冲方法
该方法读取磁盘中显示区域对应的数据,将读取的数据绘制成波形显示。由于该方法将对音频数据的所有操作都放到磁盘中,这样会导致用户在操作时,必须反复读取磁盘上的数据,由于读取速度相对较慢,所以严重影响了绘制波形的时间。
2.全缓冲方法
该方法先将所有音频数据存储到内存上,读取内存显示区域对应的数据,将数据绘制成波形显示,在用户对显示区域的数据进行操作(或调整显示区域)时,需继续读取内存中的数据,将操作后的数据绘制成波形进行显示。
由于该方法将所有音频数据存储到内存中,相比于第一种方法加快了绘制波形的速度,但由于内存容量相对于磁盘容量要小许多,对于大容量的音频数据,无法将整个音频数据全部存储到内存中,无法适用大容量的音频数据。
可见,现有的音频数据绘制方法在绘制大容量音频文件的波形时,存在速度慢、操作时间长、工作效率低下的问题,特别是对于多分辨率音频波形的绘制,当分辨率改变时,需要针对每一个分辨率重新进行一遍计算,比较浪费时间。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于金字塔式多分辨率的音频波形绘制方法,通过该方法在音频波形绘制时,能够大量的减少重复计算,提高绘制的效率。
为实现上述目的,本发明采用的技术方案如下:
一种基于金字塔式多分辨率的音频波形绘制方法,包括以下步骤:
(1)根据分辨率的不同创建金字塔模型,每一级分别保存不同分辨率下的采样点的音频幅度值与该级每秒所读取的采样数;
(2)创建一种格式的音频文件,保存金字塔模型中各级的采样点的音频幅度值;
(3)根据分辨率的不同,计算音频文件每秒应读取的最佳采样数,根据该采样数确定应读取的金字塔模型中的级别;
(4)读取音频文件中金字塔模型相应级别的数据,绘制音频波形图。
进一步,如上所述的音频波形绘制方法,步骤(1)中,金字塔模型中下一级的采样点是在上一级的基础上进行取值的,下一级在上一级的基础上每两个采样点取一个。
进一步,如上所述的音频波形绘制方法,步骤(1)中所述采样点,对于单声道音频,一个采样点包括音频波形的最小极值和最大极值;对于双声道音频,一个采样点包括音频波形的左声道的最小极值和最大极值、右声道的最小极值和最大极值。
进一步,如上所述的音频波形绘制方法,所述采样点在保存到金字塔模型中时,设置了极值的排列顺序。
进一步,如上所述的音频波形绘制方法,步骤(2)中,所述创建一种格式的音频文件,保存金字塔模型中各级的采样点的音频幅度值的具体方式为:
首先,根据音频文件名字,生成对应的音频文件;
其次,将计算出的金字塔各级的采样点的音频幅度值分别保存到音频文件中。
进一步,如上所述的音频波形绘制方法,如果音频文件名字对应的音频文件存在,则直接从音频文件中读取相应的采样点的音频幅度值。
进一步,如上所述的音频波形绘制方法,所述音频文件文件头中保存有音频名称、文件属性、金字塔的级数、每一级数值的起始位置和每一级包含的采样数。
再进一步,如上所述的音频波形绘制方法,步骤(3)中,所述每秒应读取的最佳采样数的计算公式如下:
上式中,最佳采样数是指音频文件满足一个像素显示一个采样点时的采样数,播放时间是指音频文件的总播放时间。
更进一步,如上所述的音频波形绘制方法,步骤(4)中,所述读取音频文件中金字塔模型相应级别的数据,绘制音频波形图的具体方式为:
在音频文件的文件头中找到保存的每一级的起始位置;
找到相应一级的数据保存的起始位置,读取该级的采样点的音频幅度值画波形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新奥特(北京)视频技术有限公司,未经新奥特(北京)视频技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010610395.9/2.html,转载请声明来源钻瓜专利网。