[发明专利]一种基于深度卷积网络的视频环路滤波器在审
申请号: | 201910511992.7 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110351568A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 张淑芳;范增辉 | 申请(专利权)人: | 天津大学 |
主分类号: | H04N19/82 | 分类号: | H04N19/82;H04N19/503;H04N19/593;H04N19/70 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频滤波 网络模型 滤波 训练数据集 环路滤波 视频编码 卷积 网络 视频 视频编码过程 环路滤波器 帧间预测帧 帧内预测帧 编码效率 视频重建 损失函数 网络训练 优化目标 帧间预测 图像帧 训练集 最小化 重建 构建 整合 图像 制作 | ||
1.一种基于深度卷积网络的视频环路滤波方法,其特征在于,该方法包括以下流程:
步骤1、选择图像数据集和视频数据集,对数据集中未压缩的原始图像和视频进行压缩,将图像数据集压缩后得到的失真图像和原始图像制作成帧内预测帧滤波网络的训练数据集;将视频压缩后的得到的失真图像帧和原始图像帧制作成帧间预测滤波网络的训练数据集;
步骤2、构建用于视频滤波的网络模型,该模型包括多个卷积层、激活层和归一化层,不同卷积层之间存在跨卷积层短路连接;第一层卷积层将输入图像表征成特征图,最后一层的卷积层则重建压缩图像与原始图像间的残差,中间层为失真图像与原始图像的非线性映射的残差学习单元;
步骤3、将步骤1获得的两种训练数据集,分别训练用于帧内预测帧滤波和帧间预测帧滤波的两种不同特性的网络模型,这两种模型分别对视频中不同类型的帧进行滤波;以最小化损失函数为优化目标,对视频滤波网络模型进行训练,两种模型的损失函数相同,只是训练的数据集不同,训练出的两个模型特性不同,分别针对不同类型的视频帧滤波。给定训练集N为训练集中训练亮度块的个数,xi为压缩后失真的亮度块,yi为未压缩的原始亮度块;则亮度网络的损失函数数学表达如下:
其中,Θ表示网络的参数集,该损失函数通过反向传播小批量随机梯度下降算法优化,网络模型的初始权重使用适用于ReLU激活函数的MSRA初始化方法;
步骤4、将步骤3中训练好的视频滤波网络模型整合到视频编码软件中,除去编码软件中的去方块滤波和自适应像素补偿模块,以完成整个视频编码过程,得到经视频滤波网络后的重建帧。
2.如权利要求1所述的一种基于深度卷积网络的视频环路滤波方法,其特征在于,所述步骤2中的残差单元采用两种外部残差学习策略,定义残差图像R的表达式如下:
R=Y-X
其中,X表示压缩后的重建图像,Y表示未压缩的原始图像。
3.如权利要求1所述的一种基于深度卷积网络的视频环路滤波方法,其特征在于,所述步骤2中的残差单元采用两种外部残差学习策略,定义残差图像R的表达式如下:
Dl+1=R(Dl)=h(Dl)+F(Dl,Wl)
其中,Dl表示第l个残差单元的输入特征,Wl={Wl,k|1≤k≤K}表示与第l个残差单元相关的权重(包括偏置),K表示残差单元中的层数,F表示残差函数,h表示恒等映射函数:h(Dl)=Dl。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910511992.7/1.html,转载请声明来源钻瓜专利网。