[发明专利]结合语义分割的多描述编码方法及系统有效

专利信息
申请号: 201911175793.X 申请日: 2019-11-26
公开(公告)号: CN110909744B 公开(公告)日: 2022-08-19
发明(设计)人: 孟丽丽;李雪;谭艳艳;张佳;万文博;张化祥 申请(专利权)人: 山东师范大学
主分类号: G06V10/26 分类号: G06V10/26;G06N3/08;G06V10/774;G06V10/82;G06V20/70
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李圣梅
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结合 语义 分割 描述 编码 方法 系统
【说明书】:

发明公开了结合语义分割的多描述编码方法及系统,包括:将原始图像与相对应的语义分割标签作为输入传至多描述特征生成网络;多描述特征生成网络利用图像上下文特征生成相似但又不完全相同的两个描述;生成的两个描述分别进入语义分割编码网络中编码,在该编码器中,描述首先上采样成与原始图像大小一致的上采样图像,之后与语义分割映射一起经过生成网络生成残差图像,残差图像又与上采样图像像素相加得到粗重构图像;生成的粗重构图像经信息道传输至多描述解码网络,而语义分割标签被标准编码器编码之后也传输至多描述解码网络,经解码得到最终重构图像。避免了因为传输过程中丢包问题导致的图像重构质量不理想的后果,更好的提高了编码效率。

技术领域

本发明属于图像压缩领域,尤其涉及结合语义分割的多描述编码方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。

多描述编码是一种在图像视频通信领域中常见的差错控制技术,主要作用是在数据传输过程中尽可能减少失误。多描述编码的主要思想是:一个输入信源编码成多个描述并且在网络上进行传输,利用这些描述中的一个或者多个实现信源重建。显然,重建质量会随着收到的描述增多而提高。20世纪70年代,Bell实验室提出了信道分离问题,即将信号进行奇偶采样形成两路信号并在两个信道上传输,这是最早的多描述编码的思想。至此,多描述问题被正式提出,但是在早期一直处于理论研究阶段,直到Vaishampayan等提出了一个实用型的多描述标量量化器(MDSQ,Multiple Description Scalar Quantization)。之后多描述编码从理论研究向实用型系统开发转变。典型的多描述编码方法举例如下:基于采样的多描述编码、基于量化的多描述编码、基于相关变换的多描述编码、基于运动矢量的多描述编码和基于运动补偿的多描述编码方案等。

因为多描述编码有效地解决了传统信源编码在不可靠网络传输时的丢包问题以及网络延迟导致图像重建、视频重建的质量下降的问题,因此成为了一个热门的研究话题。在编码端,信源被编码成多个优先级一样的比特流(称之为描述),让这些比特流在多个相互独立的信道上进行传输。在解码端,每一个描述都能被独立解码,以此重建可接受质量的图像或者视频序列。而且在解码端接收到描述数量越多,重建图像或视频序列的质量也会越好。即使有一部分描述在传输过程中丢失也无需等待丢失的描述重新传输,解码端同样可以根据接收到的描述与丢失的描述之间的相关性,来估计出丢失的那部分描述而且获得重建图像或视频序列。这种做法一定程度上解决了因为重新传输所造成的延时,保证了信息传输的及时性。显然,接受到的描述数量越多,重建图像质量越好,信息传输的可靠性越高。

传统的图像编码是一个编码器仅处理一个比特流,不同于此的是多描述编码可以生成多个不同的描述。其中每个描述既包括共有的一些特征又包括本身特有的信息。接收端解码重建时即使有的描述丢失了,共有的特征也能够以顺利重建可接受质量的图像。然而,假设一个描述包含了太多的共有特性,即使接收端收到了全部的描述最后的重建也不会有太大的意义。所以,必须保证描述之间的相关性又要保证描述的独立性。

语义分割是根据图像的内容将图像的像素分割成不同的对象,图像中的不同物体分别用不同的颜色标记,可以让用户对图像有更细致的了解。目前,语义分割对自动驾驶、图像搜索引擎以及医学图像应用等方面都是非常重要的。基于此,我们的方法使用语义分割图作为映射与原始图像一起生成多描述图像,并结合语义分割映射进一步获得重构图像。语义分割映射作为辅助信息能够弥补原图像与网络生成图像一定程度的差异性,从而能够获得更高分辨率的生成图像。随着深度学习的愈发成熟,在语义分割上的应用也逐渐提高,但是我们的最终目的并不是研究语义分割而是结合语义分割作其他方向的研究。

到目前为止,神经网络与深度学习在图像视频处理方面取得了非常好的成就,许多新的技术方法都有了突破。其中包括生成对抗网络(GANs,Generative AdversarialNetworks),GANs通常用于生成接近于自然的重构图像,实际用途类似于二进制分类器。GANs包括两个网络:生成网络G以及判别网络D。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911175793.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top