[发明专利]频谱包络的样本值的基于上下文的熵编码在审
申请号: | 201911105761.2 | 申请日: | 2014-07-15 |
公开(公告)号: | CN110895945A | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 弗洛林·基多;安德烈·尼德迈尔 | 申请(专利权)人: | 弗朗霍夫应用科学研究促进协会 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/032;G10L19/038;G10L21/038 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 频谱 包络 样本 基于 上下文 编码 | ||
1.一种用于对音频信号的频谱包络(10)的样本值(12)进行解码的基于上下文的熵解码器,用于:
在频谱时间上预测(42)所述频谱包络的当前样本值,以获得所述当前样本值的估计值;
根据对所述当前样本值的频谱时间邻近区域中的频谱包络的成对的已解码的样本值之间的偏差的测量,确定(44)用于所述当前样本值的上下文;
使用确定的上下文,熵解码(46)所述当前样本值的预测残差值;以及
结合(48)所述估计值与所述预测残差值,以获得所述当前样本值。
2.根据权利要求1所述的基于上下文的熵解码器,还用于通过线性预测以执行频谱时间预测。
3.根据权利要求1所述的基于上下文的熵解码器,还用于使用所述当前样本值的所述频谱时间邻近区域中的所述频谱包络的所述成对的已解码的样本值之间的带符号的差,以测量所述偏差。
4.根据权利要求1所述的基于上下文的熵解码器,还用于根据对所述当前样本值的所述频谱时间邻近区域中的所述频谱包络的第一对已解码的样本值之间的偏差的第一测量,以及对所述当前样本值的所述频谱时间邻近区域中的所述频谱包络的第二对已解码的样本值之间的偏差的第二测量,确定用于所述当前样本值的上下文,其中所述第一对在频谱上彼此邻近,且所述第二对在时间上彼此邻近。
5.根据权利要求4所述的基于上下文的熵解码器,还用于通过线性地结合所述第一对和第二对的已解码的样本值,在频谱时间上预测所述频谱包络的所述当前样本值。
6.根据权利要求5所述的基于上下文的熵解码器,还用于设定线性结合的因子,以使得在所述音频信号被编码的比特率大于预设阈值的情况下,对于不同的上下文,所述因子是相同的;而在所述比特率低于所述预设阈值的情况下,对于不同的上下文,单独地设定所述因子。
7.根据权利要求1所述的基于上下文的熵解码器,还用于在解码所述频谱包络的样本值中,使用解码顺序(30),顺序地解码所述样本值,所述解码顺序(30)按照时刻遍历所述样本值,其中在每个时刻中从最低频率至最高频率。
8.根据权利要求1所述的基于上下文的熵解码器,还用于在确定所述上下文中,量化对所述偏差的测量,并使用量化的测量确定所述上下文。
9.根据权利要求8所述的基于上下文的熵解码器,还用于在对所述偏差的测量的量化中使用量化函数(32),所述量化函数(32)对于在预设区间(34)之外的对所述偏差的测量的值为恒定的,所述预设区间包括零。
10.根据权利要求9所述的基于上下文的熵解码器,其中所述频谱包络的值被表示为整数,且所述预设区间(34)的长度小于或等于所述频谱包络的值的整数表示的可表示状态的数目的1/16。
11.根据权利要求1所述的基于上下文的熵解码器,还用于将由结合推导的所述当前样本值从对数域转换(50)至线性域。
12.根据权利要求1所述的基于上下文的熵解码器,还用于在熵解码所述残差值中,沿着解码顺序,顺序地解码所述样本值,并使用各个的上下文概率分布的集合,所述各个的上下文概率分布在顺序地对频谱包络的样本值进行解码的期间为恒定的。
13.根据权利要求1所述的基于上下文的熵解码器,还用于在熵解码所述残差值中,在所述残差值在预设值域(68)之外的情况下,使用逸出编码机制。
14.根据权利要求13所述的基于上下文的熵解码器,其中所述频谱包络的所述样本值被表示为整数,且所述预测残差被表示为整数,且所述预设值域的区间边界(70,72)的绝对值低于或等于所述预测残差值的可表示状态的数目的1/8。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗朗霍夫应用科学研究促进协会,未经弗朗霍夫应用科学研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911105761.2/1.html,转载请声明来源钻瓜专利网。