[发明专利]基于集成学习和概率模型的快速VVC帧内预测方法有效
申请号: | 202010618890.8 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111711815B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 赵铁松;黄雨航;吴陆狄;徐艺文;王楷 | 申请(专利权)人: | 福州大学 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/593;G06N3/04;G06N20/20 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 概率 模型 快速 vvc 预测 方法 | ||
1.一种基于集成学习和概率模型的快速VVC帧内预测方法,其特征在于,包括以下步骤:
步骤S1:基于集成学习并利用视频序列的时空域相关性,预测得到不同编码单元的深度信息;
步骤S2:使用时空域相邻已编码CU的划分模式对未编码CU的划分模式进行预测,并按概率大小排序得到划分模式排序表;
步骤S3:根据得到的不同编码单元的深度信息和划分模式排序表,提前终止CU的划分;所述步骤S1具体为:
步骤S11:选定深度图参考单元,若当前帧领域存在已编码CU,就选定其深度图单元信息作为参考,否则选定前一帧相应位置的深度图单元信息作为参考;
步骤S12:读取数据集,对数据样本进行预处理,并送入三个不同的卷积神经网络进行网络训练,得到基于集成学习的深度预测模型;
步骤S13:将多尺度参考信息分别送入步骤S12训练好的三个卷积神经网络中,得到三个深度图单元预测值U1、U2及U3,使用多数投票法集成三个卷积神经网络的预测结果作为最终的输出;
步骤S14、获得CU预测深度图后,使用预测深度图的平均值作为最终CU的预测深度DO;
所述选定深度图参考单元的函数表达式如下:
其中X(x,y,t)表示第t帧位于(x,y)位置的深度图单元,其中Δx和Δy表示-n到n的整数。
2.根据权利要求1所述基于集成学习和概率模型的快速VVC帧内预测方法,其特征在于,所述最终CU的预测深度DO具体为:
其中:表示向下取整函数;K和Uk分别表示该CU所包含的深度单元数目及该CU所包含的第k个深度单元的预测值。
3.根据权利要求1所述的基于集成学习和概率模型的快速VVC帧内预测方法,其特征在于,所述步骤S2具体为:
步骤S21:获取参考CU的信息,选取13个时空域相邻的用于划分模式预测的参考CU构成集合S;
步骤S22:选取集合S中所有参考CU的划分模式构成集合R;
步骤S23:计算属于集合R的划分模式M成为最佳划分模式的概率P(bm=M|M∈R);
步骤S24:在获得了所有划分模式M成为最佳划分模式的概率之后,按照概率值大小对属于R的划分模式进行排序,将其余不属于R的模式排在之后,得到最佳划分模式排序表;
步骤S25:使用划分模式排序表进行划分模式决策,若当前划分模式的RD代价值Rcur大于目前获得的最小RD代价值Rmin,则跳过其它还未测试的划分模式以减少编码复杂度,否则测试下一个模式并更新Rcur与Rmin。
4.根据权利要求3所述的基于集成学习和概率模型的快速VVC帧内预测方法,其特征在于,所述集合S的表达式如下:
S={Sref,Scur}
其中Sref及Scur分别表示位于当前帧及前一帧的参考CU集合,Sref及Scur的定义分别如下:
Sref={C(x+iw,y+jh,t-1)|-1≤i≤1,-1≤j≤1,i∈Z,j∈Z}
Scur={C(x-w,y-h,t),C(x,y-h,t),C(x+w,y-h,t),C(x-w,y,t)}
其中w和h分别表示CU的像素值长度和宽度。
5.根据权利要求3所述的基于集成学习和概率模型的快速VVC帧内预测方法,其特征在于,所述集合R具体为:
R={MCU|CU∈S}
其中MCU表示CU的划分模式,S为步骤S21获取的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010618890.8/1.html,转载请声明来源钻瓜专利网。