[发明专利]加权矩阵系数的自适应量化有效
申请号: | 202010687098.8 | 申请日: | 2016-03-21 |
公开(公告)号: | CN111899746B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 班基·塞蒂亚万;艾雅·苏谟特 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/038;G10L19/16;H04N19/126;H04N19/44 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 加权 矩阵 系数 自适应 量化 | ||
本发明为加权矩阵系数的自适应量化,涉及一种用于将包括信号帧的输入信号编码为量化比特的方法。所述方法包括:针对输入信号(101)的每个帧生成包括从所述帧获得的矩阵系数的信号矩阵(103、203、CovM#1,...,CovM#N);将每个信号矩阵的矩阵系数分组成多个分区矢量为每个分区矢量选择矢量量化方案中的一个矢量量化方案并根据所选择的矢量量化方案量化所述分区矢量以获得量化比特(108、208)。在自适应模式下,所述方法包括:对从不同帧获得的矩阵系数进行不同的分组,和/或为从不同帧获得的分区矢量选择不同的矢量量化方案。
本申请为2018年8月15号递交中国专利局,申请号为201680081847.4,申请名称为“加权矩阵系数的自适应量化”的中国专利申请的分案,本申请全部内容包含在母案中。
技术领域
本发明大体涉及音频和/或视频编码领域。本发明具体涉及一种用于将包括音频和/或视频帧的输入信号编码为量化比特的编码器,用于将量化比特解码为包括音频和/或视频帧的输出信号的解码器以及相应的编码和解码方法。最后,本发明涉及一种具有用于执行这种方法的程序代码的计算机程序。
背景技术
在音频和/或视频应用中,常见的问题是对大输入数据进行有效地编码。例如,已知的音频应用可以基于涉及6个以上通道(5.1)的编码方案,而未来的编码方案预计将采用任意数量的输入通道,以使甚至更多的通道和更多的输入数据不得不被处理和编码。此外,针对22.2个通道,已知使用通道/目标编码方案,参见2014年12月Herre,J.,Hilpert,J.,Kuntz,A.和Plogsties,J.发表在音频工程学会杂志的第62卷,第12期,第821–830页的“MPEG-H音频-通用空间/3D音频编码的新标准”以及支持多达32个通道的球形麦克风。
从这方面来说,要解决的关键问题之一是找到一种方法来有效地编码大量的矩阵系数或元素。这些矩阵系数通常衍生于特定类型的矩阵,如协方差矩阵。例如,在基于Karhunen-Loeve变换(Karhunen-Loeve Transform,简称KLT)的音频编码方案中清楚地示出了证明,参见2001年7月Yang,D.,Ai,H.,Kyriakakis,C.和Kuo,C.-C.J.发表在SPIE会议录的数据/图像编码,压缩及加密IV的数学和应用的第4475卷,第43–54页的“增强多通道音频编码的自适应Karhunen-Loeve变换”。该方案要求传输至少一个大小为M×M的协方差矩阵,其中M表示输入通道的数量。如果在频域中进行编码,矩阵的数量甚至更重要。而且,如果处理必须以帧为单位进行更新,例如,每20毫秒,则矩阵的数量进一步增加。
在图像或视频编码领域,编码问题更为明显。在这种情况下,要被编码的矩阵可以不是方矩阵,而是非对称矩形矩阵。要量化的矩阵基本上由从图像输入信号获得的图像元素组成。图像编码中的应用的更多描述的概述被呈现在例如1996年2月Cosman,P.C.,Gray,R.M.和Vetterli,M.发表在IEEE图像处理汇刊的第5卷,第2号的“概述:图像子带的矢量量化”。量化大量矩阵系数的已知方法包括简单地进行标量量化或一维矢量量化(one-dimensional vector quantization,简称1-D VQ)。然而,众所周知,相应的编码效率是有限的,并不可观。编码大量矩阵系数的其它已知方法使用若干现有技术的矢量量化(vectorquantization,简称VQ)方案,例如直接VQ、分裂VQ或增益-形状VQ。然而,现有技术的主要问题之一是难以选择适合一组通用输入信号的特定方案。其他已知的编码器在应用VQ方案之前尝试对矩阵本身进行预处理。这种预处理的示例包括通过变换过程对矩阵的对角元素进行归零。
发明内容
意识到上述提到的缺点和问题,本发明旨在改善现有技术。特别地,本发明的目的是提供用于对包括例如信号帧的输入信号的编码/解码进行改善的编码器,编码方法,解码器和解码方法。
本发明特别旨在改善大输入数据的编码/解码。本发明还旨在改善对输入信号和例如对一组通用输入信号的矢量量化方案的选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010687098.8/2.html,转载请声明来源钻瓜专利网。