[发明专利]一种自适应音频感知响度调整方法有效
申请号: | 201210005515.1 | 申请日: | 2012-01-10 |
公开(公告)号: | CN102610232A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 冯伟;万亮;谭志羽;江建民 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L21/02 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 音频 感知 响度 调整 方法 | ||
技术领域
本发明属于多媒体信息处理和音频分析领域,涉及一种自适应音频感知响度估计与快速归一化的新型技术,可用于将不同响度感知基准的音频文件自动调整为统一的感知响度基准。
背景技术
ReplayGain(回放增益)标准是David Robinson于2001年提出的一套技术标准,用以衡量MP3音乐文件的感知响度,并对音频响度进行增益归一化处理(见文献:D.Robinson,″ReplayGain specification discussion″,www.replaygain.org,2010)。具体步骤是,首先对整个音频文件进行心理声学扫描,以量度它的感知响度和峰值电平;进而计算音频文件的原始响度与目标响度(通常定为89分贝的声压值)的差别增益值;将该音频文件的增益值和峰值电平值作为元数据存储于音频文件中,以便播放器能够根据这些元数据自动衰减(或放大)音量播放该文件,从而在回放不同的音频文件时得到近似一致的输出响度。ReplayGain标准可以缓解在播放不同专辑的音频文件时需要不断手动调整音量的问题,并避免对响度较高的歌曲产生削波。然而,ReplayGain标准对于音频文件感知响度的衡量采用了固定阈值(95%最大能量)的估计方法,难以保证其对不同类型音频感知响度的估计精度,尤其不能很好地剔除音频中由于自然发声过程所引起的极低与极高响度成份的不良影响,从而使得所估计的响度偏离真实听觉感知响度区间。
发明内容
本发明的目的是针对现有技术在自动估计不同音频文件的感知响度上的不足,提供一套实用的音频感知响度自适应调整方法,可以使用户方便地将不同音量基准的音频文件更为准确地自动调整到统一的感知响度基准。
为此,本发明采用如下的技术方案:
一种自适应音频感知响度调整方法,包括以下步骤:
a)对当前音频信号进行等响度滤波;
b)计算RMS能量序列:首先,将滤波后的音频信号按照时间间隔分割成若干个窗口,设每个窗口的数据量为M,计算每个窗口的均方根值,得到整个音频文件的RMS能量序列;
c)能量分贝转换:将RMS能量序列转换为分贝序列,并对分贝序列进行升序排序得到SDB序列;
d)采用差分法计算SDB序列的二阶导数SDB″序列;
e)设置一个局部窗口,利用局部均值对SDB″序列进行平滑操作,去除干扰噪声,得到wSDB″序列;
f)如果wSDB″序列长度大于某一特定阈值时,采用线性插值亚采样的方法降低样本数量,亚采样后的平滑二阶导数序列仍记为wSDB″序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210005515.1/2.html,转载请声明来源钻瓜专利网。