[发明专利]使用改进的概率分布估计的基于线性预测的音频编码有效

专利信息
申请号: 201380043524.2 申请日: 2013-06-19
公开(公告)号: CN104584122B 公开(公告)日: 2017-09-15
发明(设计)人: 汤姆·贝克斯特伦;克里斯蒂安·黑尔姆里希;纪尧姆·富克斯;马库斯·穆尔特鲁斯;马丁·迪策尔 申请(专利权)人: 弗劳恩霍夫应用研究促进协会
主分类号: G10L19/032 分类号: G10L19/032;G10L19/08;G10L19/00
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 康建峰,陈炜
地址: 德国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 改进 概率 分布 估计 基于 线性 预测 音频 编码
【说明书】:

技术领域

发明涉及基于线性预测的音频编码,并且具体地,涉及使用频谱编码的基于线性预测的音频编码。

背景技术

用于在频域中进行量化和编码的经典方法为获取信号的(重迭)窗,执行时间频率变换,应用感知模型(perceptual model),以及通过熵编码器(诸如算术编码器)来量化各个频率[1]。感知模型基本上为加权函数,将其与频谱线相乘,使得每一加权频谱线中的误差具有相等的感知影响。因此能够以相同准确度量化所有的加权线,并且总体准确度确定感知质量与位消耗之间的折衷。

在USAC的AAC及频域模式(非TCX)中,逐频带地界定感知模型,使得一组频谱线(谱带)将具有相同权重。这些权重称作比例因子,这是因为这些权重界定了频带通过什么因子进行按比例调整(scale)。此外,对这些比例因子进行差分编码。

在TCX域中,这些权重并未使用比例因子来编码,而是通过界定频谱包络的LPC(线性预测系数,linear prediction coefficient)模型[2]来进行编码,频谱包络为频谱的总体形状。使用LPC是因为其允许在TCX与ACELP之间平滑切换。然而,LPC并不能很好地对应于感知模型(LPC应更加平滑),从而将称作加权的处理应用于LPC,使得被加权的LPC近似地对应于所期望的感知模型。

在USAC的TCX域中,频谱线由算术编码器来编码。算术编码器是基于将概率分配给信号的所有可能组配,使得高概率值可用数目较少的位进行编码,使得位消耗最小化。为了估计频谱线的概率分布,编码解码器(codec)使用概率模型,该概率模型在时间频率空间中基于先前已编码的线来预测信号分布。先前的线被称为待编码的当前线的环境(context)[3]。

最近,NTT建议一种用于改进算术编码器的环境的方法(比较[4])。该方法是基于使用LTP来确定谐波线的近似位置(梳形滤波器(comb-filter))并且重新布置这些频谱线,使得根据环境的量值(magnitude)预测更有效率。

通常而言,概率分布估计越好,则通过熵编码实现的压缩就越有效率。有利的是即将获得能够实现质量与使用上文概述的技术中的任一种可获得的质量类似、但复杂性降低的概率分布估计的原理。

发明内容

因此,本发明的目标是提供具有改进的特性的基于线性预测的音频编码方案。该目标由独立权利要求的主题来实现。

本发明的一个基本发现为:可通过使用针对该多个频谱分量中的每个频谱分量根据线性预测系数信息确定的概率分布估计对包括多个频谱分量的频谱进行编码来改进基于线性预测的音频编码。具体地,总能获得该线性预测系数信息。因此,该信息可用于在编码侧和解码侧确定概率分布估计。该概率分布估计的确定可通过使用例如在该多个频谱分量处对该概率分布估计的适当参数化以计算上简单的方式来实施。总之,由熵编码提供的编码效率与使用环境选择达到的概率分布估计兼容,但概率分布估计的求导较不复杂。例如,该求导可单纯地以分析方式进行和/或不需要关于邻近频谱线的属性的任何信息,诸如在空间环境选择的情况下的邻近频谱线的先前被编码/解码的频谱值。例如,此继而使计算处理的并行化更为容易。此外,可需要更少的内存要求和更少的内存访问。

根据本申请的一个实施例,频谱(其频谱值通过使用如刚刚概述地确定的概率估计进行熵编码)可以是使用线性预测系数信息获得的变换编码激励。

根据本申请的一个实施例,例如,频谱却是在感知加权域中界定的变换编码激励。即,使用所确定概率分布估计来熵编码的频谱对应于使用变换函数来预滤波的音频信号频谱,该变换函数对应于由线性预测系数信息界定的感知加权的线性预测合成滤波器,并且针对多个频谱分量中的每个频谱分量,确定多个分布参数,使得概率分布参数在频谱上遵循函数(例如,为该函数的按比例调整版本),该函数取决于该线性预测合成滤波器的传递函数(transfer function)与该线性预测合成滤波器的感知加权修改的传递函数的倒数(inverse)的乘积。对于多个频谱分量中的每个频谱分量,多个分布估计则为通过相应频谱分量的概率分布参数来参数化的可参数化函数。而且,总能获得线性预测系数信息,并且概率分布参数的求导可实施为单纯的分析处理和/或不需要在该频谱的不同频谱分量处的频谱值之间的任何互依性的处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380043524.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top