[发明专利]混合视频编码工具的用例驱动上下文模型选择在审

专利信息
申请号: 202080018742.0 申请日: 2020-03-04
公开(公告)号: CN113647106A 公开(公告)日: 2021-11-12
发明(设计)人: 乔纳森·普法夫;菲利普·赫勒;米夏埃尔·沙费尔;托比亚斯·欣茨;比约恩·施塔伦贝格尔;菲利普·默克尔;海科·施瓦茨;德特勒夫·马尔佩;托马斯·威甘德 申请(专利权)人: 弗劳恩霍夫应用研究促进协会
主分类号: H04N19/13 分类号: H04N19/13;H04N19/159;H04N19/176
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 潘剑颖
地址: 德国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 混合 视频 编码 工具 驱动 上下文 模型 选择
【说明书】:

描述了一种包括编码器的装置。编码器接收图像或视频数据,对所接收到的图像或视频数据进行编码,并提供表示图像或视频数据的比特流。编码器包括CABAC编码器。CABAC编码器接收与要编码的图像或视频数据块相关联的二进制值语法元素,并使用选定的上下文模型将二进制值语法元素编码为比特流的编码比特。二进制值语法元素包括工具标志,其指示在对图像或视频数据的块进行编码时是否采用特定编码工具,例如,线性加权帧内预测LWIP。对于具有大于2的纵横比且特定编码工具适用的图像或视频数据的块,从一个或多个第一上下文模型的组中选择用于对工具标志进行编码的第一上下文模型,并且对于具有小于或等于2的纵横比且特定编码工具适用的图像或视频数据的块,从一个或多个第二上下文模型的组中选择用于对工具标志进行编码的第二上下文模型。

技术领域

发明涉及编码/解码图片、图像或视频的领域,更具体地,涉及使用上下文自适应二进制算术编码CABAC引擎的上下文或上下文模型,对一个或多个编码工具进行编码,所述编码工具例如是通用视频编码VVC标准的仿射线性加权帧内预测LWIP或基于矩阵的帧内预测MIP。实施例涉及基于根据要处理的图像或视频数据的块的纵横比选择的上下文模型对标记(例如,intra_mip_flag)进行编码,该标记指示VVC标准的LWIP或MIP的适用性。

背景技术

在最先进的视频编码标准,例如ITU T H.265|MPEG H HEVC[1]中,图片被分成固定正方形大小的编码树单元(CodingTreeUnits),其可以进一步被细分为更小的块。这种块的重构信号通常是预测信号和残差信号的叠加。通过将相邻邻域的样本外推到当前块中(帧内预测)或通过从一个或两个参考图片复制滤波或未滤波的样本表示(帧间预测)来获得预测信号。参考图片是已经从比特流重构并且存储在图片缓冲器中以供参考的图片。残差信号是通过对从比特流中读取的去量化变换系数进行逆变换而获得的。在块重构过程之后,应用环路滤波器对重构块的信号进行增强并获得重构图片。

从比特流中读取诸如变换系数deltaQP、帧内预测模式、运动矢量差异等符号的熵解码过程由解析器完成,该解析器使用上下文自适应二进制算术编码(CABAC)引擎将从比特流中读取的比特转换为二进制决策(比特位(bin))。解析器将这些比特位转换或组合成符号或语法元素。熵编码过程的自适应性是通过使用CABAC上下文(CC)来实现的。每个上下文表示自适应概率模型,该模型对特定符号或符号集的熵进行建模。术语自适应指示模型向当前编码状态的持续更新。因此,该模型适配于相应符号的局部统计。更新步骤通常嵌入在算术编码运算中。首先,CC的当前状态用于对算术编码过程进行参数化。然后,一旦解码符号被导出,它就被用于以给定的步长朝向当前解码概率更新CC。

在JEM软件[2]以及即将推出的VVC标准[3]中,已经评估并采用了有关算术编码过程的各种改进。算术编码引擎已经被改变,并且CC的初始化和更新过程也已经被改进。概率表示的动态范围以及CC的更新过程的行为已经被改进。每个CC具有单独的两级更新步骤,该步骤控制CC朝向当前概率的适配强度。该改进有助于根据预期CC使用统计来自定义CC更新过程。

由于传输语法元素所需的大量二进制决策,以及由于语法元素本身的数量,二进制决策必须使用相同的CC进行分组,以达到可由解码器处理的实际CC数或CC量。此外,分组有助于更新过程利用本地统计数据,并提高基础概率模型的稳定性。

属于同一语法元素的具有统计相似概率的二进制决策通常被分组为一个CC。这种分组的例外在二进制决策可能具有不同概率的情况下产生,这些概率可以从相邻邻域中的已解码符号中预测出来。在这种情况下,所选择的CC是从相邻邻域中的已解码符号中预测出来的。这样的过程通常应用于在比特流中相当频繁地传输的符号。

除了上下文控制的算术编码外,还有一种固定概率为0.5的旁路模式。这种被并入算术编码器中的旁路模式是一种用于高吞吐量的低复杂度模式。例如,旁路模式被广泛用于变换编码。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080018742.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top