[发明专利]基于音频关注度的分级编码方法及系统无效
申请号: | 201010530779.X | 申请日: | 2010-11-03 |
公开(公告)号: | CN101950562A | 公开(公告)日: | 2011-01-19 |
发明(设计)人: | 胡瑞敏;杭波;杨玉红;杨裕才;高丽;赵云;王松;王国英;周超群 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L19/14 | 分类号: | G10L19/14;G10L19/02 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张火春 |
地址: | 430072*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音频 关注 分级 编码 方法 系统 | ||
1.一种基于音频关注度的分级编码系统,其特征在于,包括:
预处理模块:对输入信号进行预处理,其输入为音频原始信号,输出为预处理后的信号,预处理后的信号做两路输出:一路输出给核心编码器模块;一路输出给残差映射模块;
核心层编码模块:采用通用的编码算法对来自预处理模块的输入信号进行编码,编码后作两路输出,其中一路输出为核心层码流,作为码流的一部分,另一路输出为解码后的重构信号,输出给残差映射模块;
残差映射模块:预处理模块输出的预处理后的信号和核心层编码模块输出的解码后重构的信号为本模块的输入,用预处理后的信号和解码后的重构信号得到残差信号,本模块的输出为残差信号;
子带划分模块:残差映射模块输出的残差信号为本模块的输入,本模块对残差信号进行子带划分,得到子带残差信号,输出给量化/编码模块;
关注度计算模块:该模块的输入为关注度分析信号,关注度分析信号可以是预处理后的信号,也可以是解码后的重构信号,但不局限于这两种特征信号,本模块输出为子带关注度值,输出给基于关注度比特分配模块;
基于关注度比特分配模块:根据关注度计算模块输出的子带关注度值,对子带关注度值按照从高到低的顺序进行排序,提取子带关注度值最大的子带,该模块的输出为子带关注度值最大的子带编号,用于指导量化/编码模块的比特分配;
量化/编码模块:由子带划分模块输出的子带信号作为本模块的输入,并通过基于关注度比特分配模块输出的子带编号进行量化编码,该模块的输出为扩展层码流,作为码流的一部分。
2.根据权利要求1所述的基于音频关注度的分级编码系统,其特征在于:
所述关注度计算模块中,通过关注度分析信号来计算每个子带关注度值大小,依据每个子带关注度值按照从大到小的顺序,然后逐个子带进行编码。
3.根据权利要求1或2所述的基于音频关注度的分级编码系统,其特征在于:
所述关注度计算模块中,子带关注度值可以根据子带能量的高低,空间线索变化的快慢以及子带能量变化的快慢等特征进行计算或基于其中部分特征进行计算。
4.一种基于音频关注度的分级编码方法,其特征在于,包括以下步骤:
①输入音频信号,所述输入音频信号可以是单声道或多声道信号,预处理可以包括高通滤波、分帧等处理,得到预处理后的音频信号s(n);
②由步骤①所得的预处理后的音频信号作为核心层编码的输入,核心层编码进行编码后,一路输出为核心编码码流作为码流的一部分,另一路作解码得到解码后的重构信号
③由步骤①得到预处理后的音频信号s(n)和由步骤②得到解码后的重构信号获得残差信号e(n),对e(n)进行子带划分,划分成N个子带,其中N≥1;
④计算N个子带的每个子带关注度值,此步骤首先确定计算输入的关注度分析信号,关注度分析信号可以是预处理后的信号s(n),也可以是解码后的重构信号但不局限于这两种信号,然后将子带按照子带关注度值的大小将子带从大到小进行排序;
⑤提取未编码子带子带关注度值最大的子带编号;
⑥根据步骤⑤获得的音频关注度值最大的子带编号,首先对该子带进行量化编码,如果关注度分析信号为预处理后的信号s(n),编码端需要对子带编号进行编码,如果关注度分析信号为预处理后的信号则编码端不需要对子带编号进行编码;
⑦判断用于编码的比特数是否用尽,是则结束编码,否则返回步骤⑤。
5.根据权利要求4所述的基于音频关注度的分级编码方法,其特征在于,所述步骤④进一步包括以下子步骤:
子带划分的步骤:对输入的关注度特征信号进行子带的划分;
特征参数提取的步骤:提取子带关注度计算所需特征参数,包括ILD、子带能量等特征参数;
子带关注度计算的步骤:结合特征参数提取的步骤计算的特征参数,得到这个子带关注度值,子带关注度值的计算方法可以根据具体情况的不同,设计不同的模型;
子带排序的步骤:根据子带关注度计算的步骤计算出的各个子带关注度值将子带从大到小进行排序。
6.根据权利要求5所述的基于音频关注度的分级编码方法,其特征在于:
所述子带关注度计算的步骤中,子带关注度值的计算方法为:
f(si,Ii)=si*Ii
其中,si为子带空间音频参数,Ii为子带的能量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010530779.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小蓟保健肉制品
- 下一篇:叉烧肉的配比及制作工艺