[发明专利]基于集成学习和概率模型的快速VVC帧内预测方法有效
申请号: | 202010618890.8 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111711815B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 赵铁松;黄雨航;吴陆狄;徐艺文;王楷 | 申请(专利权)人: | 福州大学 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/593;G06N3/04;G06N20/20 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 概率 模型 快速 vvc 预测 方法 | ||
本发明涉及一种基于集成学习和概率模型的快速VVC帧内预测方法,包括以下步骤:步骤S1:基于集成学习并利用视频序列的时空域相关性,预测得到不同编码单元的深度信息;步骤S2:使用时空域相邻已编码CU的划分模式对未编码CU的划分模式进行预测,并按概率大小排序得到划分模式排序表;步骤S3:根据得到的不同编码单元的深度信息和划分模式排序表,提前终止CU的划分。本发明在保证视频质量的前提下,有效地节省了视频编码时间,用于目前主流的高清、超高清视频编码时,优势更加明显。
技术领域
本发明涉及视频编码技术领域,具体涉及一种基于集成学习和概率模型的快速VVC帧内预测方法。
背景技术
视频编码的目的是为了剔除视频中存在的大量冗余信息(如时域冗余,空域冗余,统计冗余,熵冗余等),以压缩视频文件的占用空间,提高视频在存储及传输时的效率。
VVC是新一代视频编码标准,通过对原有编码框架中的各模块进行算法更新与技术提升来实现更高的压缩效率,例如:在帧内预测中,引入了基于跨分支线性模型的帧内预测技术、基于位置的帧内预测合并技术及更多的角度预测模式;在帧间预测中,引入了仿射运动预测技术、先进时域运动矢量预测技术、自适应运动矢量分辨率技术、基于8×8块的运动补偿技术及高精度(1/16像素值)运动矢量存储及补偿技术;在变换和量化中,引入了多重变换选择技术及变换系数编码时隐藏符号数据的技术,并扩大了的量化参数的取值范围;在CU划分过程中,引入了更为精细的二叉、三叉及四叉树划分方式以提升编码压缩率。然而新技术的引入在提高压缩率的同时也增加了编码时间。
发明内容
有鉴于此,本发明的目的在于提供一种基于集成学习和概率模型的快速VVC帧内预测方法,在保证视频质量的前提下,基于集成学习与概率模型方法,有效地节省了视频编码时间。
为实现上述目的,本发明采用如下技术方案:
一种基于集成学习和概率模型的快速VVC帧内预测方法,包括以下步骤:
步骤S1:基于集成学习并利用视频序列的时空域相关性,预测得到不同编码单元的深度信息;
步骤S2:使用时空域相邻已编码CU的划分模式对未编码CU的划分模式进行预测,并按概率大小排序得到划分模式排序表;
步骤S3:根据得到的不同编码单元的深度信息和划分模式排序表,提前终止CU的划分。
进一步的,所述步骤S1具体为:
步骤S11:选定深度图参考单元,若当前帧领域存在已编码CU,就选定其深度图单元信息作为参考,否则选定前一帧相应位置的深度图单元信息作为参考;
步骤S12:读取数据集,对数据样本进行预处理,并送入三个不同的卷积神经网络进行网络训练,得到基于集成学习的深度预测模型;
步骤S13:将多尺度参考信息分别送入步骤S12训练好的三个卷积神经网络中,得到三个深度图单元预测值U1、U2及U3,使用多数投票法集成三个卷积神经网络的预测结果作为最终的输出;
步骤S14、获得CU预测深度图后,使用预测深度图的平均值作为最终CU的预测深度DO。
进一步的,所述选定深度图参考单元的函数表达式如下:
其中X(x,y,t)表示第t帧位于(x,y)位置的深度图单元,其中Δx和Δy表示-n到n的整数。
进一步的,所述最终CU的预测深度DO具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010618890.8/2.html,转载请声明来源钻瓜专利网。