[发明专利]基于卷积神经网络的VVC块划分快速预测方法及系统在审

专利信息
申请号: 202111555140.1 申请日: 2021-12-17
公开(公告)号: CN114219973A 公开(公告)日: 2022-03-22
发明(设计)人: 伏长虹;张小洲;洪弘 申请(专利权)人: 南京理工大学
主分类号: G06V10/774 分类号: G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08;H04N19/103;H04N19/11
代理公司: 南京理工大学专利中心 32203 代理人: 陈鹏
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 卷积 神经网络 vvc 划分 快速 预测 方法 系统
【说明书】:

发明公开了一种基于卷积神经网络的VVC块划分快速预测方法及系统,包括:输入大小为32×32的编码单元和其量化参数QP,预处理后作为卷积神经网络的输入,经过卷积操作后,最终输出对当前CU的划分预测结果,对CU最可能的划分形式:水平、垂直、不划分或是复杂形式做出预测。本发明有效地降低了编码单元的多类型划分的复杂度,减少了所需的编码时间;并在提高编码速度的同时,保证了最终解码端的视频质量。

技术领域

本发明属于视频编解码技术领域,具体涉及一种基于卷积神经网络的VVC块划分快速预测方法及系统。

背景技术

由于视频分辨率的不断提高以及VR视频等技术的发展,导致视频码率急剧上升,因此ITU-T和ISO/IEC成立了JVET工作组并开始H.266/VVC编码标准的研制工作,2020年VVC第一版标准正式发布。VVC沿用了基于块的混合编码框架,延续了HEVC的大部分编码工具的基础上,在各个模块都添加了一些新的编码工具,或者对其中的编码工具进行了优化。VVC除了按四叉树划分,还可以按多类型树划分。具体来说,VVC中CTU首先按照四叉树划分成不同CU,然后四叉树叶子节点的CU可以按照多类型树进行划分,包括四种划分类型:垂直二叉树划分(BV)、水平二叉树划分(BH)、垂直三叉树划分(TV)、水平三叉树划分(TH),其中三叉树按照1:2:1划分。

如图1所示,编码块划分采用递归设计。面对水平或者垂直特征比较明显的编码块,以及平滑编码块,复杂的多种划分方式造成很多无效的冗余编码。因此,为降低算法复杂度,快速判断编码块的划分类型是一种有效途径。文献“Park S H,Kang J W.Context-based Ternary Tree Decision Method in Versatile Video Coding for Fast IntraCoding[J].IEEE Access,2019,PP(99):1-1.”利用VVC编码上下文识别了三叉树划分特征,并因此提出了一种简单的早期决策技术,降低三叉树划分复杂性。文献“Wu G,Huang Y,ZhuC,et al.SVM Based Fast CU Partitioning Algorithm for VVC Intra Coding[C]//2021IEEE International Symposium on Circuits and Systems(ISCAS).IEEE,2021.”提出了一种基于支持向量机的VVC帧内编码快速CU分割算法,通过使用纹理信息预测CU的分区,提前终止冗余分区,提高编码效率。但是这些方法都需要预先提取出编码块的特征,算法的有效性与特征的选取紧密相关。

近年来,在视频编码框架内继续使用传统方法改进编码性能变得越来越困难,基于神经网络的视频编码逐渐成为可能。

发明内容

本发明的目的在于提供一种基于卷积神经网络的VVC块划分快速预测方法及系统,在保证编码质量的前提下,降低编码单元多类型划分的计算复杂度,节约编码时间。

实现本发明目的的技术解决方案为:一种基于卷积神经网络的VVC块划分快速预测方法,包括如下步骤:

步骤1、数据收集:选取不同的视频,每隔M帧选取1帧,每个视频共计选取N帧,在不同量化参数QP下用原始VVC编码器进行编码,并收集以下数据作为训练集:32×32大小的编码单元CU的像素值,量化参数QP作为输入信息,编码过程中该CU的最优划分方式所属类别作为对应的标签;所属类别包括水平划分、垂直划分、不划分、四叉树划分;

步骤2、数据训练:对于训练集中的CU,将CU的亮度值进行去均值预处理,作为卷积神经网络的输入,随后进行四次卷积计算,最终得到1×1的特征;将QP值作为先验输入全连接层,并将输出的特征与CU的特征叠加,经过softmax作为划分结果的输出,和标签对应;经过训练后得到一个用于VVC块划分快速预测的网络;

步骤3、模型部署:在VVC实际编码过程中,对于每一个32×32大小的CU,将CU亮度值、QP值输入到上述训练好的网络中,得到对当前CU的最优划分的预测,根据该预测进行后续编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111555140.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top