[发明专利]基于学习的视频编解码系统有效

专利信息
申请号: 201810064012.9 申请日: 2018-01-23
公开(公告)号: CN108174218B 公开(公告)日: 2020-02-07
发明(设计)人: 陈志波;何天宇;金鑫;刘森 申请(专利权)人: 中国科学技术大学
主分类号: H04N19/503 分类号: H04N19/503;H04N19/593;H04N19/192;H04N19/147;H04N19/70
代理公司: 11260 北京凯特来知识产权代理有限公司 代理人: 郑立明;郑哲
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 空时域 迭代 预测 残差 重构 视频编解码 视频内容 输出码流 分析器 合成器 输出 卷积神经网络 循环神经网络 量化 视频编码率 解码 编码框架 编码输出 迭代编码 熵编码器 熵解码器 编解码 编码块 二值化 框架本 熵编码 熵解码 建模 相减 学习 内存 失真 存储 网络 并用 优化
【说明书】:

发明公开了一种基于学习的视频编解码框架,包括:空时域重构内存,用于存储经编码与解码之后的重构视频内容;空时域预测网络,用于利用重构视频内容的空时域相关性,通过卷积神经网络以及循环神经网络对其建模,输出当前编码块的预测值;预测值与原始值相减形成残差;迭代分析器与迭代合成器,逐级对输入残差编解码;二值化器,将迭代分析器的输出量化为二值表示;熵编码器,对量化后的编码输出进行熵编码,后获得输出码流;熵解码器,对输出码流进行熵解码,后输出给迭代合成器。该编码框架,通过基于学习的VoxelCNN(空时域预测网络)实现了空时域的预测,并用残差迭代编码的方法实现视频编码率失真优化的控制。

技术领域

本发明涉及视频编解码技术领域,尤其涉及一种基于学习的视频编解码框架。

背景技术

现有的图像视频编码标准诸如:JPEG、H.261、MPEG-2、H.264、H.265,均基于混合编码框架。经过多年的发展,编码性能的提升伴随着复杂度的不断增加,进一步在现有混合编码架构下提升编码性能也面临越来越多的挑战。

但是,目前混合编码框架通常按照启发式的方法实现图像视频的优化编码,越来越难以满足当下诸如人脸识别、目标跟踪、图像检索等复杂、智能的媒体应用需求。

发明内容

本发明的目的是提供一种基于学习的视频编解码框架,可以实现视频编码率失真优化的控制。

本发明的目的是通过以下技术方案实现的:

一种基于学习的视频编解码框架,其特征在于,包括:编码端与解码端;其中编码端包括:空时域重构内存、空时域预测网络、迭代分析器、迭代合成器、二值化器、熵编码器以及熵解码器;

所述空时域重构内存,用于存储经编码与解码之后的重构视频内容;

所述空时域预测网络,用于利用重构视频内容的空时域相关性,通过卷积神经网络以及循环神经网络对其建模,输出当前编码块的预测值;

所述迭代分析器,包含卷积神经网络与循环神经网络结构,将所述空时域预测网络输出的预测值与原始相减形成的残差作为输入,输出为该残差的压缩表达;

所述迭代合成器,包含卷积神经网络与循环神经网络结构,接收熵解码器解码产生的上述残差的压缩表达,并叠加所述空时域预测网络输出的预测值,形成重构视频内容;

所述迭代分析器与迭代合成器,逐级对输入残差编解码,通过增加码流为代价逐步减少残差的失真程度,实现高低码流情况下不同失真程度的编码;

所述二值化器,将迭代分析器的输出量化为二值表示;

所述熵编码器,对量化后的编码输出进行熵编码,后获得输出码流;

所述熵解码器,对输出码流进行熵解码,后输出给迭代合成器。

由上述本发明提供的技术方案可以看出,集成了空时域预测与残差迭代编码方法,通过基于学习的VoxelCNN(空时域预测网络)实现了空时域的预测,并用残差迭代编码的方法实现视频编码率失真优化的控制。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种基于学习的视频编解码框架示意图;

图2为本发明实施例提供的视频编解码框架的主要处理过程示意图;

图3为本发明实施例提供的运动插补过程示意图;

图4为本发明实施例提供的运动延伸过程示意图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810064012.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top