[发明专利]针对H.266/VVC的快速CU分区和帧内决策方法有效
申请号: | 202010262211.8 | 申请日: | 2020-04-06 |
公开(公告)号: | CN111462261B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 张秋闻;黄立勋;蒋斌;王祎菡;吴庆岗;常化文;王晓;张伟伟;赵永博;崔腾耀;郭睿骁;赵进超;孟颍辉;钱晓亮;甘勇 | 申请(专利权)人: | 郑州轻工业大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06V10/764 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张真真 |
地址: | 450002 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 266 vvc 快速 cu 分区 决策 方法 | ||
1.一种针对H.266/VVC的快速CU分区和帧内决策方法,其特征在于,其步骤如下:
S1、利用标准差计算当前CU的纹理复杂度,并根据纹理复杂度将当前CU分为平滑区域CU、普通区域CU或复杂区域CU;
S2、如果当前CU为平滑区域CU,执行步骤S5,如果当前CU为普通区域CU,执行步骤S3,如果当前CU为复杂区域CU,执行步骤S6;
S3、判断当前CU的深度是否小于最大划分深度3,若是,执行步骤S4,否则,执行步骤S5;
S4、对当前CU进行水平二进制划分、垂直二进制划分、水平三进制划分、垂直三进制划分或四叉树划分,返回步骤S3对划分后的CU进行深度判断;
S5、利用原始预测方式对当前CU进行编码,输出最佳帧内模式预测;
S6、提取当前CU的特征属性,并利用随机森林分类器模型进行分类,根据分类结果对当前CU划分为子CU;
所述利用随机森林分类器模型进行分类的方法为:
S61、采集M个视频序列,每个视频序列各N帧,对M*N帧视频序列进行CU遍历,记录复杂区域CU的划分结果作为数据集,数据集包括样本集S和测试集T,其中,划分结果包括不划分、水平二进制划分、垂直二进制划分、水平三进制划分、垂直三进制划分、四叉树划分;
S62、利用基于Bagging集成方法对样本集S进行重采样生成训练样本集
S63、随机选择一个训练样本并将训练样本作为当前节点,其中,i=1,2,…,K表示第i个训练样本,K表示训练样本集的大小;
S64、在当前节点上随机选择m个特征属性,计算每个特征属性的Gini指标系数,从中选择Gini指标系数最小的特征属性作为根节点的最优分裂属性,以最小Gini指标系数为分裂阈值,将m个特征属性划分为左子树、右子树;
S65、计算左子树、右子树分别与最优分裂属性的距离,将距离较小的子树作为当前节点,循环执行步骤S64,直至节点深度为D,得到训练样本对应的决策树Ti;
S66、循环执行步骤S63至步骤S65,直至生成训练样本集对应的决策树{T1,T2,...,TK},得到随机森林分类器RFC;
S67、利用步骤S66中得到的随机森林分类器RFC对测试集T进行判别分类,将K棵决策树输出最多的类别作为测试集T的所属类别,得到当前CU的划分方式;
S7、利用基于纹理区域特征的快速帧内预测模式优化方法对子CU进行帧内模式预测,输出最佳帧内模式;
所述利用基于纹理区域特征的快速帧内预测模式优化方法对子CU进行帧内模式预测的方法为:
S71、将67种帧内预测模式分为0°、45°、90°和145°四个方向,其中,0°方向包括模式0、模式1和模式11-26,45°方向包括模式0、模式1、模式2-10和模式59-66,90°方向包括模式0、模式1和模式43-58,145°方向包括模式0、模式1和模式27-42;
S72、利用Canny算子计算子CU的每个像素的梯度:
Gx(x′,y′)=P(x′+1,y′)-P(x′,y′)+P(x′+1,y′+1)-P(x′,y′+1)(10),
Gy(x′,y′)=P(x′,y′)-P(x′,y′+1)+P(x′+1,y′)-P(x′+1,y′+1)(11),
其中,Gx(x′,y′)表示像素P(x′,y′)的梯度在水平方向上的分量,Gy(x′,y′)表示像素P(x′,y′)的梯度在垂直方向上的分量,P(x′,y′)表示在子CU中位置(x′,y′)的像素值;
S73、根据步骤S72中的每个像素的梯度计算每个像素的梯度幅值和角度:
Ampx′,y′=|Gx(x′,y′)|+|Gy(x′,y′)|(12),
其中,Ampx′,y′表示每个像素的梯度幅值,θx′,y′表示每个像素的梯度角度;
S74、由梯度幅值和角度可得梯度向量(Ampx′,y′·cosθx′,y′,Ampx′,y′·sinθx′,y′),方向0°、45°、90°、135°的单位向量分别为(1,0)、(0,1)和计算各像素在四个方向上的投影:
其中,和分别代表各像素在0°、45°、90°、135°方向上投影;
S75、计算子CU的像素在四个方向上的投影总和,即能量:
其中,Pd表示d方向对应的能量,d∈{0°、45°、90°、145°},W'表示子CU的宽度,H'表示子CU的高度,表示和
S76、按照从大到小的顺序对四个能量进行排序,E1E2E3E4,E1、E2、E3、E4分别与P0o、P45o、P90o、P145o相对应;
S77、如果E2α*E1,则子CU包含两种纹理方向,执行步骤S78,反之,则子CU包含一种纹理方向,执行步骤S79,其中,α表示决策因子;
S78、能量E1对应的方向为主方向,能量E2对应的方向为辅方向,删除主方向和辅方向中的相同模式,利用主方向和辅方向的模式对子CU进行编码预测,并计算编码后的率失真值,将率失真值最小的模式作为最佳的帧内预测模式;
S79、能量E1对应的方向为主方向,利用主方向的模式对子CU进行编码预测,并通过计算编码后的率失真值,将率失真值最小的模式作为最佳的帧内预测模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学,未经郑州轻工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010262211.8/1.html,转载请声明来源钻瓜专利网。