[发明专利]基于深度神经网络的视频压缩方法有效
申请号: | 201710758241.6 | 申请日: | 2017-08-29 |
公开(公告)号: | CN107396124B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 马展;陈彤;刘浩杰 | 申请(专利权)人: | 南京大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/503;H04N19/124;H04N19/91;G06N3/04;G06N3/08 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度神经网络的视频压缩方法,步骤如下:收集并整理视频图像数据集,构建神经网络训练集、测试集和交叉验证集;建立多层的深度神经网络;对于帧间预测,利用运动估计算法寻找最佳匹配块,并计算残差和帧间预测的均方差;预测完成后将残差作为新的训练数据训练残差编码网络,残差网络模型包括帧内残差和帧间残差;预测和残差神经网络的输出数据经过量化和无损熵编码一起作为固定长度码流的压缩数据;解码端通过与编码端对称的神经网络将压缩数据还原,并重建恢复出压缩后图像。本发明的视频压缩方法,与传统H.264视频编码方法在大量测试视频序列上的同等比较中,可以在相同质量上平均节省26%左右的码率。 | ||
搜索关键词: | 基于 深度 神经网络 视频压缩 方法 | ||
【主权项】:
1.基于深度神经网络的视频压缩方法,其特征在于,包括如下步骤:S1,收集和整理规范的高清视频图像数据集,构建神经网络训练集、测试集和交叉验证集;S2,建立多层的预测神经网络和残差神经网络:将所述神经网络训练集中的图像分为无交叠的M×N块,用于训练视频编码的预测模型,预测模型包括帧内预测模式和帧间预测模式;S3,对于帧间预测模式,利用运动估计算法,在视频的前一帧的对应区域内寻找最佳匹配块,并计算残差和帧间预测的均方差;S4,根据所述均方差以及设定的阈值来选择预测模型的模式为帧内预测模式或帧间预测模式:设定帧内预测模式和帧间预测模式选择的阈值,若均方差小于阈值,则保留原有的帧间预测模式;若均方差大于阈值,则选择帧内预测模式;S5,预测模式选择完成后,将残差作为新数据训练残差编码网络,保存训练模型,训练模型包括帧内残差模式和帧间残差模式;S6,最终预测神经网络和残差神经网络的输出数据经过量化和无损熵编码一起作为固定长度码流的压缩数据;S7,解码端通过与编码端对称的神经网络将步骤S6中的压缩数据还原成M×N块,并重建恢复出压缩后的图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710758241.6/,转载请声明来源钻瓜专利网。