[发明专利]一种自适应音频感知响度调整方法有效

申请号：	201210005515.1	申请日：	2012-01-10
公开（公告）号：	CN102610232A	公开（公告）日：	2012-07-25
发明（设计）人：	冯伟;万亮;谭志羽;江建民	申请（专利权）人：	天津大学
主分类号：	G10L19/00	分类号：	G10L19/00;G10L21/02
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	程毓英
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于多媒体信息处理和音频分析领域，涉及一种自适应音频感知响度调整方法，包括：对于当前音频文件进行等响度滤波；对于音频信号按特定窗口大小计算其RMS能量值，从而得到整个音频文件的RMS能量序列；将RMS能量序列转换为分贝值序列，并对其进行升序排序；对升序的分贝值序列利用差分法计算二阶导数，并利用局部窗口平均法进行二阶导数序列的平滑处理；当序列过长时，对原始序列进行亚采样；在平滑后的二阶导数序列上搜索当前音频的最优稳定分贝区间，计算此区间的平均分贝值作为当前音频文件的最优稳定响度。采用线性映射的方法对该音频进行响度调整。本发明具有运行速度快、校正准确、符合声学感知、性能稳定、无损音频音质等优点。
搜索关键词：	一种自适应音频感知响度调整方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种自适应音频感知响度调整方法，包括以下步骤：a)对当前音频信号进行等响度滤波；b)计算RMS能量序列：首先，将滤波后的音频信号按照时间间隔分割成若干个窗口，设每个窗口的数据量为M，计算每个窗口的均方根值，得到整个音频文件的RMS能量序列；c)能量分贝转换：将RMS能量序列转换为分贝序列，并对分贝序列进行升序排序得到SDB序列；d)采用差分法计算SDB序列的二阶导数SDB″序列；e)设置一个局部窗口，利用局部均值对SDB″序列进行平滑操作，去除干扰噪声，得到wSDB″序列；f)如果wSDB″序列长度大于某一特定阈值时，采用线性插值亚采样的方法降低样本数量，亚采样后的平滑二阶导数序列仍记为wSDB″序列；g)构造衡量某一时间区间[t1，t2]是否为最优稳定分贝空间可能性的能量函数 E ( t 1 , t 2 ) = α ( t 2 - t 1 ) + ( 1 - α ) std ( wSDB ′ ′ ( t 1 - t 2 ) ) , 其中，std(·)为标准差，α为调制系数，wSDB″(t1→t2)表示wSDB″序列中从t1到t2的子段，遍历所有可能的时间区间[t1，t2]组合，求出其中能量函数取值最大的时间区间作为最优稳定分贝区间，并在此区间上求均值，得到当前音频文件的最优稳定分贝代表值；h)按照83dB标准，恢复当前音频文件的最优稳定响度。i)在当前音频文件的最优稳定响度的基础上，采用线性映射的方法，调整该音频的实际响度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210005515.1/，转载请声明来源钻瓜专利网。

上一篇：基于微流控芯片的养鱼水环境有害菌实时检测方法与装置
下一篇：一种不含异山梨醇酐聚氧乙烯脂肪酸酯的聚山梨酯

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种自适应音频感知响度调整方法有效

专利文献下载