[发明专利]基于深度神经网络的视频压缩方法有效
申请号: | 201710758241.6 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107396124B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 马展;陈彤;刘浩杰 | 申请(专利权)人: | 南京大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/503;H04N19/124;H04N19/91;G06N3/04;G06N3/08 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 视频压缩 方法 | ||
1.基于深度神经网络的视频压缩方法,其特征在于,包括如下步骤:
S1,收集和整理规范的高清视频图像数据集,构建神经网络训练集、测试集和交叉验证集;
S2,建立多层的预测神经网络和残差神经网络:将所述神经网络训练集中的图像分为无交叠的M×N块,用于训练视频编码的预测模型,预测模型包括帧内预测模式和帧间预测模式;
S3,对于帧间预测模式,利用运动估计算法,在视频的前一帧的对应区域内寻找最佳匹配块,并计算残差和帧间预测的均方差;
S4,根据所述均方差以及设定的阈值来选择预测模型的模式为帧内预测模式或帧间预测模式:设定帧内预测模式和帧间预测模式选择的阈值,若均方差小于阈值,则保留原有的帧间预测模式;若均方差大于阈值,则选择帧内预测模式;
S5,预测模式选择完成后,将残差作为新数据训练残差编码网络,保存训练模型,训练模型包括帧内残差模式和帧间残差模式;
S6,最终预测神经网络和残差神经网络的输出数据经过量化和无损熵编码一起作为固定长度码流的压缩数据;
S7,解码端通过与编码端对称的神经网络将步骤S6中的压缩数据还原成M×N块,并重建恢复出压缩后的图像。
2.根据权利要求1所述的基于深度神经网络的视频压缩方法,其特征在于,所述步骤S3中,首先,设置一个滑动的M×N的窗口,在视频的前一帧对应的局部区域内挑选出均方误差最小的块区域作为最佳匹配块,同时兼顾结果和复杂度,设定(M+a)×(N+a)的搜索范围,进行运动估计算法,计算帧间预测的均方差,其中M和N为块尺寸,a为向外搜索的范围。
3.根据权利要求1所述的基于深度神经网络的视频压缩方法,其特征在于,所述步骤S7中,解码端的神经网络同编码端的神经网络对称,将固定长度码流的压缩数据通过解码端还原成M×N的固定块,并最后重新拼接成原图像,即为恢复的压缩之后的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710758241.6/1.html,转载请声明来源钻瓜专利网。