[发明专利]基于深度学习的图像压缩神经网络模型、及其方法和设备在审
申请号: | 202110379367.9 | 申请日: | 2021-04-08 |
公开(公告)号: | CN113141506A | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 杜卫丹;顾昌铃;沈文杰;张利宏;李钰靓;汪建伟 | 申请(专利权)人: | 上海烟草机械有限责任公司;浙江中烟工业有限责任公司 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/13;H04N19/149;H04N19/33;G06N3/04;G06N3/08;G06T7/00;G06T7/13 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李治东 |
地址: | 201206 上海市浦东新区中*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 图像 压缩 神经网络 模型 及其 方法 设备 | ||
本申请提供了一种基于深度学习的图像压缩神经网络模型、及其方法和设备,通过输入所述原始图像,经编码器生成具有空间变化标准差的服从正态分布的空间特征;令所述空间特征进行量化,同时将所述空间特征通过统计概率编码器进行编码和量化以得到压缩的边缘像素统计信息;将量化后的空间特征与边缘像素统计信息经熵编码以生成压缩图像数据。本申请可实现视觉检测器合格及缺陷所有图像的全保存,在保持高压缩率的同时保留图像更多的信息,使还原之后的图像质量更高;在相同的图像质量下,有更小的压缩率;在更小的压缩率下,比其他方法有相近的压缩和解压时间,从而为卷烟生产企业建立卷烟产品质量追溯体系及在线视觉检测装置的二次复检提供基础。
技术领域
本发明涉及图像压缩技术领域,特别是涉及一种基于深度学习的图像压缩神经网络模型、及其方法和设备。
背景技术
目前卷烟包装设备上配置了大量视觉成像检测装置以用于检测及剔除不合格烟包,从而提高卷烟产品的质量。但由于包装机运行速度极快,短时间内这些视觉装置就会形成大量的图像文件,难以储存、传输,因此一般视觉检测器只存储缺陷照片。
对图像信息进行重新编码,以较少的比特数来表示原来图像内容的技术称为图像压缩。图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。信息时代带来了“信息爆炸”,使数据量大增,因此,无论传输或存储都需要对数据进行有效的压缩。
图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩,这是因为有损压缩方法,尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像,例如一些应用中图像的微小损失是可以接受的(有时是无法感知的),这样就可以大幅度地减小位速。
无损图像压缩常见的方法有:行程长度编码,熵编码法,算术编码,自适应字典算法等。常用的PNG图像就是无损图像压缩。
有损图像压缩常见的方法有:色彩空间缩减,将所选择的颜色定义在压缩图像头的调色板中,图像中的每个像素都用调色板中颜色索引表示;色度抽样,利用人眼对于亮度变化的敏感性远大于颜色变化,这样就可以将图像中的颜色信息减少一半甚至更多;变换编码,即使用离散余弦(DCT)或者小波变换这样的傅里叶相关变换,进行量化和用熵编码法压缩;分形压缩等。常用的JPG图像就是有损图像压缩。
目前市面上影响力比较大的图片压缩技术是WebP和BPG。WebP是谷歌在2010年推出的一款可以同时提供有损压缩和无损压缩的图片文件格式,其以VP8为编码内核,在2011年11月开始可以支持无损和透明色功能。目前facebook、Ebay等网站都已采用此图片格式。BPG(Better Portable Graphics,更好的可移植图形)是一种新的图像格式。它是由知名程序员、ffmpeg和QEMU等项目作者FabriceBellard推出的图像格式,它以HEVC为编码内核,在相同体积下,BPG文件大小只有JPEG的一半。另外BPG还支持8位和16位通道等等。尽管BPG有很好的压缩效果,但是HEVC的专利费很高,所以目前的市场使用比较少。
就压缩效果来说,BPG更优于WebP,但是BPG采用的HEVC内核所带来的专利费,导致其无法在市场进行大范围使用。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种基于深度学习的图像压缩神经网络模型、及其方法和设备,以解决现有技术中存在的至少一个问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海烟草机械有限责任公司;浙江中烟工业有限责任公司,未经上海烟草机械有限责任公司;浙江中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110379367.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:反激式开关电源及其同步整流控制器
- 下一篇:一种折叠式电脑桌
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序