[发明专利]深度图像压缩方法及其装置、设备和存储介质在审
申请号: | 201811258164.9 | 申请日: | 2018-10-26 |
公开(公告)号: | CN111107377A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 胡强;石志儒 | 申请(专利权)人: | 曜科智能科技(上海)有限公司 |
主分类号: | H04N19/91 | 分类号: | H04N19/91;H04N19/124;H04N19/184;H04N19/597;H04N13/161 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 高彦 |
地址: | 201203 上海市浦东新区中*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 图像 压缩 方法 及其 装置 设备 存储 介质 | ||
本发明提供的一种深度图像压缩方法及其装置、设备和存储介质,通过对深度图像进行正变以得到特征系数矩阵,并通过高斯概率模型对量化后的特征系数矩阵进行熵编码以得到对应的特征系数码流,以及对所述深度图像的元信息进行旁路熵编码以得到对应的元信息码流,最后合并所述特征系数码流及所述元信息码流以作为所述深度图像的压缩数据。本发明能够深度图像压缩导致合成视图失真的问题,并且在压缩性能方面超越传统编码标准JPEG和BPG。
技术领域
本发明涉及深度图像处理技术领域。尤其是涉及一种深度图像压缩方法及其装置、设备和存储介质。
背景技术
光场视频作为一种新型的数字媒体,通过提供多个视点的视频数据使用户自由选择视点从多个角度观看三维立体场景,其独特的立体感和视点间交互功能使它广泛应用于三维电视、自由视点电视和光场监控等多个领域。光场视频包含了大量的数据信息,从而导致了存储和传输的巨大压力,如何高效地对光场视频进行压缩成为制约其发展的瓶颈。基于深度图像绘制的虚拟视图合成是光场视频应用中的关键技术,它利用参考视点的视频数据和相应的深度图像合成任意视点的视图,其合成视图的质量很大程度上依赖于深度图像的质量。
在过去的几十年中,一系列的图像编码标准被广泛地应用。目前已有的图像压缩标准有很多种,包括联合图片专家组制定的JPEG和JPEG2000,由国际标准化组织/国际电工技术委员会发布的PNG等。但上述图像压缩是针对传统图像的,并不是针对深度图像的。与视频图像不同,深度图像是包含大量的均匀区域、更多的空间冗余和锐利边界的灰度图,使用传统的图像编码方法对深度图像进行压缩会在边界处产生严重的失真,从而影响合成视图的质量。
因此,基于深度图像在图像处理和机器视觉任务中的关键作用,亟需一种针对深度图像压缩减少或取出失真的办法。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种深度图像压缩方法及其装置、电子设备和存储介质,用于解决现有技术中对深度图像进行压缩会产生严重失真的问题。
为实现上述目的及其他相关目的,本发明提供一种深度图像压缩方法,所述方法包括:对深度图像进行基于自编码网络的正变换处理以得到表征所述深度图像的信息的特征系数矩阵;对所述特征系数矩阵进行量化处理,并通过高斯概率模型对量化后的所述特征系数矩阵进行熵编码,以得到对应的特征系数码流;对所述深度图像的元信息进行旁路熵编码以得到对应的元信息码流;合并所述特征系数码流及所述元信息码流以作为所述深度图像的压缩数据。
于本发明的一实施例中,所述特征系数矩阵能经过自编码网络的反变换以重构出所述深度图像的像素值。
于本发明的一实施例中,所述正变换与所述反变换呈对称结构,分别由6层卷积层、及5层归一化层组成。
于本发明的一实施例中,所述量化处理为标量量化,包括:对输入值进行四舍五入量化处理,以及选取最接近所述输值入的整数作为输出值。
于本发明的一实施例中,在所述自编码网络进行训练时,通过增加随机均匀噪声来近似所述量化处理,使得编解码过程变得可导。
于本发明的一实施例中,所述高斯概率模型是通过对所述深度图像的特征系数进行基于高斯分布的概率建模得到的。
于本发明的一实施例中,所述对所述深度图像的元信息进行旁路熵编码以得到对应的元信息码流的方法包括:对所述深度图像的长和宽分别使用2个16比特的整数进行二进制化,并采用旁路二进制数字编码得到二进制码流;对所述高斯概率模型对应的序号使用8比特的整数进行二进制化,并采用旁路二进制数字编码得到二进制码流;汇总对应所述深度图像的长和宽的二进制码流、及对应所述高斯概率模型对应的序号的二进制码流以得到所述元信息码流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曜科智能科技(上海)有限公司,未经曜科智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811258164.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车及其车载显示装置
- 下一篇:一种陈皮柠檬罗汉果茶及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序