[发明专利]对源音频信号进行编码的方法和相应的编码设备、解码方法和设备、信号、计算机程序产品有效
申请号: | 200780015598.X | 申请日: | 2007-03-12 |
公开(公告)号: | CN101432804A | 公开(公告)日: | 2009-05-13 |
发明(设计)人: | P·菲利普;C·沃;P·科郎 | 申请(专利权)人: | 法国电信公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 郭思宇 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 进行 编码 方法 相应 设备 解码 计算机 程序 产品 | ||
技术领域
本发明涉及对诸如音乐之类的音频数字信号或数字化语音信号进行编码和解码的技术领域。
具体地说,本发明涉及在实现感知编码(perceptual encoding)中量化音频信号的谱系数的技术。
本发明特别(但不只是)可应用于在MPEG音频标准(ISO/IEC14496-3)的环境内所提出的使用可扩缩数据编码/解码型系统对音频数字数据进行分级编码(hierarchical encoding)的系统。
一般地说,本发明可以应用于对声音和音乐进行高效量化以便存储、压缩和通过传输信道(例如,无线或有线信道)传输声音和音乐的技术领域。
背景技术
1传输掩蔽曲线的感知编码
1.1音频压缩和量化
音频压缩往往基于人耳的一定听觉能力。对音频信号的编码和量化往往要考虑这个特性。在这种情况下所用的术语是“感知编码”,或者遵从人耳心理听觉模型的编码。
人耳不能区分一个信号在邻近频率和在有限时隙内发送的两个分量。这个性质称为听觉掩蔽(auditory masking)。此外,耳朵具有听觉门限(hearing threshold),在安静的环境内,将感觉不到所发送的低于听觉门限的声音。这个门限的值随声波频率改变。
在压缩和/或传输音频数字信号中,可以想到的是,确定量化比特数,以量化形成信号的频谱分量,不会引入过多的量化噪声而损害 到编码后信号的质量。目标通常是减少量化比特数量以得到对信号的高效压缩。因此,必须做的是找到声音质量与信号压缩程度之间的折衷。
所以,在经典的现有技术中,量化原理使用了人耳引起的掩蔽门限和掩蔽性质,以确定注入音频信号而在信号再现时耳朵感觉不到(即不会引入任何过分失真)的可接受的最大量化噪声量。
1.2感知音频变换编码
音频变换编码的详细说明可参见Jayant、Johnson和Safranek的“基于人类感知的方法的信号压缩”(“Signal Compression Based on Method of Human Perception”,Proc.Of IEEE,Vol.81,No.10,pp.1385-1422,October 1993)。
这种技术使用了图1所例示的人耳频率掩蔽模型,图中示出了音频信号频率与人耳掩蔽门限之间的关系的例子。X轴10表示频率f(Hz),Y轴11表示声强I(dB)。人耳将信号x(t)的频谱在频域内按Bark刻度分解成一些关键频带(critical band)120、121、122、123。信号x(t)的关键频带n 120具有能量En,在频带n内和在邻近的关键频带122和123处产生掩蔽13。所关联的掩蔽门限13与“掩蔽”分量120的能量En成正比,而随关键频带低于和高于关键频带n递减。
分量122和123在图1这个例子中受到掩蔽。此外,分量121由于低于绝对听觉门限14也受到掩蔽。于是,通过将绝对听觉门限14和与音频信号x(t)的以关键频带分析的各个分量关联的掩蔽门限组合在一起,就可以得到总的掩蔽曲线。这个掩蔽曲线表示可以在信号编码时叠加到信号上而人耳感觉不到的最大量化噪声的谱密度。于是,在量化从源音频信号频率变换得到的谱系数期间,就可形成量化步长分布(profil de pas de quantification),不很严格地也可称为注入噪声分布。
图2为例示经典的感知编码器的原理的流程图。时间源音频信号 x(t)由时间-频率变换单元20变换到频域。于是,得到由谱系数Xn形成的信号的频谱。该频谱由心理听觉模型21分析,该模型根据绝对听觉门限和信号的每个频谱分量的掩蔽门限确定信号的总掩蔽曲线C。所得到的掩蔽曲线可用来得出可以注入的量化噪声量,从而确定用来量化谱系数或样本的比特数。确定比特数这个步骤由给出每个谱系数Xn的量化步长分布Δn的二进制分配单元22执行。二进制分配单元通过用掩蔽曲线C所给出的成形限制修改量化间隔设法达到目标比特率。量化间隔Δn由二进制分配单元22以比例因子F的形式编码,再在比特流T内作为辅助信息发送。
量化单元23接收到谱系数Xn和所确定的量化间隔Δn后给出经量化的系数
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于法国电信公司,未经法国电信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780015598.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于安装可重写类型光盘的方法和设备
- 下一篇:基于LED显示的方法及装置