[发明专利]使用依赖瞬态位置的重叠对音频信号编码或译码的设备及方法有效
申请号: | 201480009744.8 | 申请日: | 2014-02-20 |
公开(公告)号: | CN105378835B | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 克里斯蒂安·黑尔姆里希;热雷米·勒孔特;戈兰·马尔科维奇;马库斯·施内尔;贝恩德·埃德勒;斯特凡·罗伊施尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/025 | 分类号: | G10L19/025 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;李春晖 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 依赖 瞬态 位置 重叠 音频 信号 编码 译码 设备 方法 | ||
一种用于对音频或图像信号进行编码的设备,包括:可控窗口化装置(102),用于将音频或图像信号窗口化,以提供窗口化样本的块的序列;转换器(104),用于将窗口化样本的块的序列转换成频谱表示,频谱表示包括频谱值的帧的序列;瞬态位置检测器(106),用于识别在帧的瞬态预看区域内的瞬态的位置;以及控制器(108),用于响应于所识别出的瞬态的位置(210‑213),控制可控窗口化装置(102),以将具有特定重叠长度的特定窗口应用至音频或图像信号,其中,控制器(108)被配置成从包括至少三个窗口的组中选择特定窗口,三个窗口包括具有第一重叠长度(203)的第一窗口(201)、具有第二重叠长度(218)的第二窗口(215)、以及具有第三重叠长度(229)或不具有重叠的第三窗口(224),其中,第一重叠长度(203)大于第二重叠长度(218),及其中第二重叠长度(218)大于第三重叠长度(229)或大于零重叠,其中,基于瞬态位置选择特定窗口,以使得两个时间相邻的重叠窗口中的一个具有瞬态的位置的第一窗口系数,而两个时间相邻的重叠窗口中的另一个具有瞬态的位置的第二窗口系数,其中第二系数是第一系数的至少九倍大。
技术领域
本发明是有关于对音频或图像信号的处理,且更特别是有关于对存在瞬态的音频或图像信号的编码或译码。
背景技术
基于重叠FFT或改进的离散余弦变换(MDCT)的现代频域语音/音频编码机制提供某些适应度给非静态信号特征。以MPEG标准化的通用编译码器,亦即MPEG-1第三层,极著名为MP3,MPEG-4(HE-)AAC [1],以及最近的MPEG-0xHE-AAC(USAC)和由IETF[2]规定的Opus/Celt编译码器,允许使用至少两个不同的变换长度之中一个对帧 (frame)的编码-关于静态信号信道的一个长度M的长变换,或8个长度M/8(每个)的短变换。在MPEG编译码器的情况下,从长到短及从短到长变换的切换(亦称为块切换)需要使用非对称窗口化的瞬态变换,亦即分别地是起始及停止窗口。这些变换形状以及其它已知的现有技术形状描绘于图16中。应注意到,线性重叠斜率仅是说明性的并以正确的形状变化。可能的窗口形状提供于AAC标准[1]及[3]的第6条中。
假定如果即将到来的帧待由MPEG编码器利用短变换来编码,则当前帧必须利用起始瞬态变换来编码,显而易见的是一个依据其中一个上述 MPEG标准来实施的编码器需要至少预看(look-ahead)的帧长度。然而,在低延迟通讯应用,理想上是可使此种额外预看最小化或甚至避免此种额外预看。为此,对于通用编码模型的两个改进方案已被提出。一个改进方案曾经被采用例如在Celt[2]中,用于将长变换的重叠减少至短变换的重叠,从而能避免不对称瞬态窗口。另一被使用于例如MPEG-4(增强)低延迟AAC编码机制的改进方案用于禁止切换至较短变换,替代地是依靠时域噪声整形(TNS)编码工具[4],其操作于长变换数上以使围绕瞬态的编码错误的时域伸展(temporal spread)最小化。
此外此外,类似xHE-AAC,低延迟AAC允许使用双帧重叠宽度-关于静态输入是默认值50%重叠,或关于非静态信号的减少的重叠(类似于瞬态变换的短重叠)。减少的重叠在系数量化的情况下有效地限制变换的时间延伸,因而是其编码错误。
受让给三星(Samsung)电子公司的美国专利2008/0140428A 1以及受让给索尼(Sony)公司的美国专利5502789及5819214揭露了信号适应性窗口或变换尺寸确定单元。然而,由所述窗口或变换尺寸确定单元所控制的变换器单元,操作于QMF或LOT子频带值(表示所说明的系统都采用串接型滤波器组或变换),相对于如在本情况下的直接地工作于时域全频带输入信号上。此外,于2008/0140428A 1中,并未详细说明关于形状或窗口重叠的控制的细节,且在5819214中,重叠形状遵循(亦即,为以下的结果)来自变换尺寸确定单元的输出,这是本发明所提出的较佳实施例的相对内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480009744.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:膜状物和座席装置
- 下一篇:在车辆/道路环境中利用流言网络的基于光的通信