[发明专利]基于深度学习的图像编码、解码系统及编码、解码方法在审

专利信息
申请号: 201910705904.7 申请日: 2019-08-01
公开(公告)号: CN110602494A 公开(公告)日: 2019-12-20
发明(设计)人: 王培;其他发明人请求不公开姓名 申请(专利权)人: 杭州皮克皮克科技有限公司
主分类号: H04N19/124 分类号: H04N19/124;H04N19/13;H04N19/149;H04N19/169
代理公司: 31317 上海恒慧知识产权代理事务所(特殊普通合伙) 代理人: 徐红银
地址: 310018 浙江省杭州市经济技术开发区白*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络模块 先验 熵编码模块 熵解码模块 分析模块 解码系统 重构模块 反变换 正变换 学习 条件概率模型 学习的条件 解码 编解码器 编码系统 传统编码 特征系数 图像编码 图像像素 无监督 熵编码 熵解码 重构 概率
【说明书】:

发明公开了一种基于深度学习的图像编码、解码系统及编码、解码方法,编码系统包括:基于深度学习的正变换网络模块、基于深度学习的条件概率超先验分析模块及熵编码模块;其中,正变换网络模块用于得到特征系数;超先验分析模块用于得到超先验特征值;熵编码模块用于熵编码。解码系统包括:熵解码模块、基于深度学习的重构模块及基于深度学习的反变换网络模块;其中,熵解码模块用于熵解码;重构模块用于得到条件概率模型;反变换网络模块用于重构出图像像素值。通过本发明,采用无监督的方式,训练得到的编解码器性能超越了多种传统编码标准。

技术领域

本发明涉及图像编码技术领域,特别涉及一种基于深度学习的图像编码、 解码系统及编码、解码方法。

背景技术

随着多媒体技术和网络通信技术的快速发展,图像多媒体应用已经覆盖 了人类生活的各个方面。大量的图像应用产生了海量的数据,如果未经压缩, 这些图像将很难应用于实际的存储和传输。图像压缩编码技术可以有效地去 除数据中的冗余信息,实现图像数据在互联网中的快速传输和离线存储。因 此,图像压缩编码技术是视频应用中的一项关键技术。

在过去的几十年中,一系列的图像编码标准被广泛地应用。目前已有的 图像压缩标准有很多种,包括联合图片专家组(Joint Pictures Experts Group)制定的JPEG和JPEG2000,Unisys公司开发并由国际标准化组织 (International Organization forStandardization,ISO)/国际电工技 术委员会(International ElectrotechnicalCommission,IEC)发布的PNG, 谷歌发布的WebP,以及法布里斯·贝拉(Fabrice Bellard)于2014年创建。 虽然传统编码标准有很多而且一直在不断推进,但是编码框架却没有发生大 的变化。比如图像编码标准基本都遵循着变换编码(transforming coding) 的框架,传统编码标准的发展趋势是用更精细更复杂的算法换取更高的编码 性能。图像编码标准迭代至今,想要进一步获取性能的增益无疑会变得越来 越难。

近年来,深度学习技术在多项图像处理和机器视觉任务中取得了重大的 突破,受到了研究人员的广泛关注。深度学习技术可以从大量的数据中学习 得到数据先验知识和自适应的变换操作,这同样适合于图像编码任务。将深 度学习用于图像编码的研究始于2015年谷歌发表的一种基于递归神经网络的 图像编码方法。最近,多项研究显示了基于深度学习的图像编码方法已经取 得了超过很多传统图像编码技术的性能。虽然这类方法发展时间还不长,但 是已经取得了和目前最好的传统编码技术相当的性能(BPG基于HEVC的帧内 编码技术,是目前性能最好的图像编码技术)。这些结果都表明基于深度学习 的图像编码技术拥有巨大的潜力,有可能取得全面超越传统方法的编码性能。 此外,相比于传统方法非常依赖专家知识和特征工程,深度学习技术有很强 的自适应性,在实际应用中可以根据特定数据进行训练以获得更高的编码效 率。新一代传统视图像编码标准的制定和发布往往需要10年时间,所以通过 对基于深度学习的图像编码的研究,期望取得编码性能的显著提升,有非常 重要的学术探索和实际应用价值。

但是上述提到的谷歌发表的一种基于递归神经网络的图像编码方法计算 量太大,阻碍了实用。所以,急需提供一种计算效率高、编码性能优越的图 像编码方法。

发明内容

本发明针对上述现有技术中存在的问题,提出一种基于深度学习的图像 编码、解码系统及编码、解码方法,提供了一套使整个编码网络可以进行端 到端优化的训练策略,且采用无监督的方式,训练得到的编码器性能超越了 多种传统编码标准。

为解决上述技术问题,本发明是通过如下技术方案实现的:

本发明提供一种基于深度学习的图像编码系统,其包括:

基于深度学习的正变换网络模块,该模块用于使图像经过正变换网络得 到表征图像信息的特征系数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州皮克皮克科技有限公司,未经杭州皮克皮克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910705904.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top