[发明专利]一种基于目标编码的端到端图像压缩方法有效
申请号: | 202010003469.6 | 申请日: | 2020-01-03 |
公开(公告)号: | CN111147862B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 马展;夏琪;刘浩杰 | 申请(专利权)人: | 南京大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/154;H04N19/146;H04N19/91;H04N19/124;H04N19/136;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 编码 端到端 图像 压缩 方法 | ||
1.一种基于目标编码的端到端图像压缩方法,其特征在于,包括如下步骤:
步骤1,将待压缩图像输入预训练完成的目标分割神经网络,得到输入图像的语义分割结果;
步骤2,将语义分割结果转化为几组二值化矩阵,矩阵元素为1的区域代表某目标位置,矩阵元素为0的区域代表图像中该目标以外的其他区域,得到图像中各目标区域掩膜和背景区域掩膜;
步骤3,将输入图像分别用若干个具有相同网络结构但不同模型参数的编码器进行编码,得到对应于不同码率的图像特征图;
步骤4,将各目标区域掩膜与相应的高码率图像特征图相乘,得到图像各目标区域的特征图;将背景区域掩膜与相应的低码率图像特征图相乘,得到图像背景区域的特征图;
步骤5,对各目标区域的特征图和背景区域的特征图进行量化操作,得到目标量化特征图和背景量化特征图;
步骤6,利用基于神经网络的信息熵计算网络,分别计算出目标量化特征图和背景量化特征图的信息熵;
步骤7,将各目标量化特征图和背景量化特征图相加,得到图像完整的特征图;
步骤8,利用计算出的信息熵对步骤7得到的图像特征图进行熵编码和熵解码;
步骤9,将熵解码得到的重建特征图输入解码器,得到重建图像;
步骤10,构建损失函数:
Loss_func=λ(1-d)+a1Rbk+a2Robj_1+a3Robj_2
其中,d为压缩图像与输入图像之间的差距;Rbk、Robj_1、Robj_2分别为图像背景区域和目标区域编码的码率;λ、a1、a2、a3为手动设置的参数;使用优化器对由编码器、解码器和信息熵计算网络组成的图像压缩模型进行端到端训练优化,设置a1>a2、a3,使得Rbk<Robj_1、Robj_2,使得重建图像各目标区域码率更高,图像背景区域码率较低。
2.根据权利要求1所述的一种基于目标编码的端到端图像压缩方法,其特征在于,所述步骤2中,处理的具体过程为:
步骤21,将图像的语义分割结果矩阵中为1的元素置为True,不为1的元素置为False;再将该布尔型矩阵转为浮点型0、1矩阵,得到类别对应于1的目标区域掩膜;
步骤22,将图像语义分割结果矩阵中为2的元素置为True,不为2的元素置为False,再将该布尔型矩阵转为浮点型0、1矩阵,得到类别对应于2的目标区域掩膜;
步骤23,重复上述步骤,可得到所有类别的目标区域掩膜;
步骤24,用一个与目标掩膜矩阵大小相同、元素值全为1的矩阵减去目标区域掩膜之和,得到图像背景区域掩膜。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010003469.6/1.html,转载请声明来源钻瓜专利网。