[发明专利]一种视频压缩方法、装置及终端设备在审
申请号: | 201911061177.1 | 申请日: | 2019-11-01 |
公开(公告)号: | CN110753225A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 武祥吉 | 申请(专利权)人: | 合肥图鸭信息科技有限公司 |
主分类号: | H04N19/13 | 分类号: | H04N19/13;H04N19/147;H04N19/184;H04N19/513 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211101 江苏省南京市雨花台*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 残差 卷积 帧重构 压缩 帧预测 网络 压缩视频 运动向量 计算运动向量 视频编码过程 视频压缩技术 计算方式 视频压缩 网络训练 终端设备 扩展性 解码 构建 相加 改进 | ||
1.一种视频压缩方法,其特征在于,包括:
构建待压缩视频中第m帧的分离卷积网络,其中1<m≤N,m、N为正整数,N为待压缩视频的总帧数;
基于所述分离卷积网络,根据第m-1帧重构帧及第m帧计算运动向量;
根据所述第m-1帧重构帧和运动向量得到第m帧预测帧;
计算所述第m帧预测帧与第m帧的残差,并根据残差网络对所述残差进行压缩得到压缩残差;
解码所述压缩残差并与所述第m帧预测帧相加,得到第m帧重构帧;
根据所述第m帧重构帧、分离卷积网络及残差网络训练所述分离卷积网络;
基于训练后的分离卷积网络对所述待压缩视频进行压缩。
2.如权利要求1所述的视频压缩方法,其特征在于,所述构建待压缩视频中第m帧的分离卷积网络包括:
构建一个分离卷积网络;
将第1帧重构帧与第2帧相加并输入所述分离卷积网络,其中所述第1帧重构帧为基于第1帧重构网络对第1帧进行重构得到的;
基于反向传播算法对所述分离卷积网络进行训练。
3.如权利要求1所述的视频压缩方法,其特征在于,所述基于所述分离卷积网络,根据第m-1帧重构帧及第m帧计算运动向量包括:
提取所述分离卷积网络中瓶颈层的参数,其中所述瓶颈层为所述分离卷积网络中尺寸最小的卷积层;
基于所述分离卷积网络,根据所述瓶颈层参数得到运动向量。
4.如权利要求1所述的视频压缩方法,其特征在于,所述根据所述第m帧重构帧、分离卷积网络及残差网络训练所述分离卷积网络包括:
将所述第m帧重构帧与第m帧比较,得到失真残差;
提取所述分离卷积网络的瓶颈层的参数,并进行量化、熵编码后得到运动比特流;
提取所述残差网络的瓶颈层的参数,并进行量化、熵编码后得到残差比特流;
根据所述失真残差、运动比特流和残差比特流算出率失真残差;
根据所述率失真残差调整所述分离卷积网络的权重参数。
5.如权利要求1所述的视频压缩方法,其特征在于,所述根据所述第m-1帧重构帧和运动向量得到第m帧预测帧包括:
将所述第m-1帧与运动向量进行分离卷积操作得到第m帧预测帧。
6.一种视频压缩装置,其特征在于,包括:
网络构建模块,用于构建待压缩视频中第m帧的分离卷积网络,其中1<m≤N,m、N为正整数,N为待压缩视频的总帧数;
运动向量模块,用于基于所述分离卷积网络,根据第m-1帧重构帧及第m帧计算运动向量;
预测帧模块,用于根据所述第m-1帧重构帧和运动向量得到第m帧预测帧;
残差模块,用于计算所述第m帧预测帧与第m帧的残差,并根据残差网络对所述残差进行压缩得到压缩残差;
重构帧模块,用于解码所述压缩残差并与所述第m帧预测帧相加,得到第m帧重构帧;
网络训练模块,用于根据所述第m帧重构帧、分离卷积网络及残差网络训练所述分离卷积网络;
视频压缩模块,用于基于训练后的分离卷积网络对所述待压缩视频进行压缩。
7.如权利要求6所述的视频压缩装置,其特征在于,所述网络训练模块包括:
失真残差单元,用于将所述第m帧重构帧与第m帧比较,得到失真残差;
运动比特流单元,用于提取所述分离卷积网络的瓶颈层的参数,并进行量化、熵编码后得到运动比特流;
残差比特流单元,用于提取所述残差网络的瓶颈层的参数,并进行量化、熵编码后得到残差比特流;
率失真单元,用于根据所述失真残差、运动比特流和残差比特流算出率失真残差;
参数调整单元,用于根据所述率失真残差调整所述分离卷积网络的权重参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥图鸭信息科技有限公司,未经合肥图鸭信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911061177.1/1.html,转载请声明来源钻瓜专利网。