[发明专利]一种使用Transformer的多层次图像压缩方法有效
申请号: | 202111138182.5 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113709455B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 刘美琴;梁甲名;林春雨;白慧慧;赵耀 | 申请(专利权)人: | 北京交通大学 |
主分类号: | H04N19/103 | 分类号: | H04N19/103;H04N19/20;H04N19/30;H04N19/42 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 邹芳德 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 transformer 多层次 图像 压缩 方法 | ||
本发明公开一种使用Transformer的多层次图像压缩方法,以Transformer模块为主,辅之以卷积层神经网络的多层次的图像压缩框架,Transformer模块包括多层编码器组件组件、解码器组件,编码端采用编码器组件,解码端采用解码器组件;解码器拥有交叉注意力机制,该交叉注意力机制将解码器的输入的自注意力特征与编码器的自注意力特征进行联合计算,对压缩压缩框架编码器的编码端学习到的特征充分利用。本发明保留了Transformer中的解码器组件及其交叉注意力机制,应用在解码端以实现对编码端学习到的特征的充分利用,达到更好的效果。且本发明框架对硬件的需求更小。
技术领域
本申请涉及计算机技术图像处理领域,尤其涉及一种使用Transformer的多层次图像压缩方法。
背景技术
随着互联网和数字媒体的飞速发展、大数据时代的到来,互联网上每天都有海量的图像数据产生、存储和传输,这些数据会占用很大空间和带宽。为了实现更高效的存储和传输图像数据,图像压缩算法应运而生。图像压缩旨在通过去除图像数据中的冗余信息以减少表示数字图像时需要的数据量,从而实现对图像数据的高效压缩,这也是图像处理领域常见的基本研究问题之一。
在较早的时期,一些经典的传统图像压缩算法被研究出来,比如离散余弦变换(DCT变化)、矢量量化、差分脉冲编码调制、游程编码、哈夫曼编码、算术编码等,传统的图像压缩框架通过使用这些算法,实现了不错的压缩效果,比如经典的JPEG标准[G.K Wallace,“The JPEG still picture compression standard”,IEEE Trans.on ConsumerElectronics,vol.38,no.1,pp.43-59,Feb.1991.],以及后来的JPEG2000[Majid Rabbani,Rajan Joshi,“An overview of the JPEG2000still image compression standard”,LSEVIER Signal Processing:Image Communication,vol.17,no,1,pp.3-48,Jan.2002.]、BPG(HEVC帧内编码)[G.J.Sullivan,J.Ohm,W.Han and T.Wiegand,“Overview of theHigh Effificiency Video Coding(HEVC)Standard”,IEEE Transactions on Circuitsand Systems for Video Technology,vol.22,no.12,pp.1649-1668,Dec.2012.]、VVC帧内编码[G.J.Sullivan and J.R.Ohm,“Versatile video coding Towards the nextgeneration of video compression”,Picture Coding Symposium,Jun.2018.]等,它们的效果都逐步提升,并且广泛地应用在互联网、工业等领域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138182.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音箱包装盒
- 下一篇:一种辐流回转斜板沉淀池
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序