[发明专利]一种图像编码方法、图像解压方法以及装置在审
申请号: | 202210447177.0 | 申请日: | 2022-04-26 |
公开(公告)号: | CN115022637A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 康宁;仇善召;张鸣天;张世枫;李震国 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N19/13 | 分类号: | H04N19/13;H04N19/182;H04N19/42;H04N19/44;H04N19/50;H04N19/91 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 吴欣蔚 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 编码 方法 解压 以及 装置 | ||
本申请提供了人工智能领域中涉及计算机视觉的一种图像编码方法、图像解压方法以及装置,用于结合自回归模型和自编码模型的输出进行编码,降低所需模型的大小,提高编解码效率。该图像编码方法包括:将输入图像作为自回归模型的输入,输出第一图像;获取第一图像和输入图像之间的残差,得到第一残差图像;并且,还将输入图像作为自编码模型的输入,输出隐变量和第一残差分布,隐变量包括从输入图像中提取到的特征,第一残差分布包括自编码模型输出的输入图像中各个像素点对应的残差值;对第一残差图像和第一残差分布进行编码,得到残差编码数据;对隐变量进行编码,得到隐变量编码数据,隐变量编码数据和残差编码数据用于解压后得到输入图像。
技术领域
本申请涉及图像处理领域,尤其涉及一种图像编码方法、图像解压方法以及装置。
背景技术
图像在各个领域使用广泛,在大量场景中都可能涉及到图像的传输或保存等。且随着图像的分辨率越高,在保存图像时所需要的存储空间消耗也就越多,在传输图像时所需的带宽也就越高,传输效率也就越低。因此,通常,为了便于图像的传输或者保存,可以对图像进行压缩,从而降低图像所占的比特数量,进而减少保存图像所需的存储空间以及传输图像所需的带宽。
例如,在一些常用的图像压缩方式中,可以采用熵编码的方式来进行图像压缩,如常用的熵编码算法有霍夫曼编码,算术编码,ANS编码等来进行图像压缩。然而,多种熵编码方式的压缩率均已达到最优,很难再进一步提高压缩率。因此,如何提高编解码效率,成为亟待解决的问题。
发明内容
本申请提供一种图像编码方法、图像解压方法以及装置,用于结合自回归模型和自编码模型的输出进行编码,降低所需模型的大小,提高编解码效率。
有鉴于此,第一方面,本申请提供一种图像编码方法,包括:将输入图像作为自回归模型的输入,输出第一图像;获取第一图像和输入图像之间的残差,得到第一残差图像;将输入图像作为自编码模型的输入,输出隐变量和第一残差分布,隐变量包括从输入图像中提取到的特征,第一残差分布包括自编码模型预测的用于表示输入图像中各个像素点和第一残差图像中各个像素点对应的残差值;对第一残差图像和第一残差分布进行编码,得到残差编码数据;对隐变量进行编码,得到隐变量编码数据,隐变量编码数据和残差编码数据用于解压后得到输入图像。
因此,本申请中,结合了自回归模型与自编码模型的输出结果进行编码,可以将自编码与自回归模型都控制到很小,避免了自编码模型的网络过大造成的推理时间过长的问题,实现高效的图像压缩。并且,本申请提供的方法中,全流程均可基于AI芯片的AI无损压缩实现,包括AI模型及熵编码,避免了系统内存与AI芯片内存的传输问题,提高编码效率。
在一种可能的实施方式中,前述的对第一残差图像和第一残差分布进行编码,得到残差编码数据,包括:将第一残差图像和第一残差分布作为半动态熵编码器的输入,输出残差编码数据,该半动态熵编码器用于使用第一预设类型的编码运算进行熵编码,第一预设类型的编码运算包括加、减或位运算,且半动态熵编码器中不包括第二预设类型的编码运算,第二预设类型包括乘、除或取余运算中的至少一种,即该半动态熵编码器中不包括乘、除或取余运算等耗时较长运算,即该半动态熵编码器中可以仅包括简单的加减运算,从而可以实现高效编码。
因此,本申请实施方式中,可以对残差图像进行半动态熵编码,以有限种分布方式进行编码,相对于动态熵编码减少了乘、除以及取余运算等耗时较多的运损,大大提高了编码效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210447177.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序