[发明专利]HEVC帧内角度模式选择方法、装置、设备及可读存储介质有效
申请号: | 202010628727.X | 申请日: | 2020-07-02 |
公开(公告)号: | CN111800642B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 李帅厂;陈小磊;刘俊;姜光心 | 申请(专利权)人: | 中实燃气发展(西安)有限公司 |
主分类号: | H04N19/593 | 分类号: | H04N19/593;H04N19/105;G06N3/0464;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 朱海临 |
地址: | 710049 陕西省西安市高新*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | hevc 角度 模式 选择 方法 装置 设备 可读 存储 介质 | ||
1.一种HEVC帧内角度模式选择方法,其特征在于,包括以下步骤:
S1:将若干输入视频帧图像分别划分为若干PU图像,将所有PU图像分类为训练集和测试集;将训练集内所有PU图像相同位置像素值计算均值得到均值图像;
S2:构建深度卷积神经网络,并将深度卷积神经网络的输出设定为35类角度模式;通过训练集和均值图像对深度卷积神经网络进行训练,通过测试集对深度卷积神经网络进行测试,得到深度卷积神经网络预测模型;
深度卷积神经网络包括依次设置的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层、第二全连接层以及输出层,输出层的输出设定为35类角度模式;第一卷积层和第二卷积层均设定为64个卷积核,卷积核大小均为5×5;第一池化层和第二池化层均设定为MaxPooling操作,池化窗口大小均为3×3;第一全连接层和第二全连接层均设定为512维神经元节点;
S3:获取待预测视频帧图像,并将其划分为若干待预测PU图像,将若干待预测PU图像通过深度卷积神经网络预测模型进行预测,得到每个待预测PU图像对应的角度模式;
具体的,按照HEVC原始的四叉树划分方式获取待预测视频帧图像所有的需要的PU图像,并对PU图像进行统一尺寸处理,统一为8×8,然后对每个像素点减去均值,得到待预测PU图像;
S4:选取数量最多的前预设个数类角度模式组成角度模式候选列表,然后通过HEVC编码流程遍历角度模式候选列表中的角度模式,得到最优角度模式。
2.根据权利要求1所述的HEVC帧内角度模式选择方法,其特征在于,所述S1的具体方法为:
将若干输入视频帧图像分别按照4种PU图像尺寸进行无重叠划分,将4种尺寸的PU图像全部缩放为同一尺寸,然后将同一尺寸的PU图像分类为训练集和测试集。
3.根据权利要求1所述的HEVC帧内角度模式选择方法,其特征在于,所述S1中,将输入视频帧图像的前50帧的PU图像作为训练集,其余帧的PU图像作为测试集。
4.根据权利要求1所述的HEVC帧内角度模式选择方法,其特征在于,所述S2中通过训练集和均值图像对深度卷积神经网络进行训练时,以及通过测试集对深度卷积神经网络进行测试时,均通过最小二乘法函数和反向传播BP算法对深度卷积神经网络进行更新与求解。
5.根据权利要求1所述的HEVC帧内角度模式选择方法,其特征在于,所述S4中,选取数量最多的前3个角度模式组成角度模式候选列表。
6.根据权利要求5所述的HEVC帧内角度模式选择方法,其特征在于,所述S4中,当数量最多的前3类角度模式中不包含Planar模式和/或DC模式时,将Planar模式和/或DC模式添加至角度模式候选列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中实燃气发展(西安)有限公司,未经中实燃气发展(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010628727.X/1.html,转载请声明来源钻瓜专利网。