[发明专利]基于视觉潜在注意力目标区域的JPEG2000图像编解码方法有效
申请号: | 201010597655.3 | 申请日: | 2010-12-21 |
公开(公告)号: | CN102036073A | 公开(公告)日: | 2011-04-27 |
发明(设计)人: | 薛建儒;李策;郑南宁 | 申请(专利权)人: | 西安交通大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 汪人和 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 潜在 注意力 目标 区域 jpeg2000 图像 解码 方法 | ||
1.基于视觉潜在注意力目标区域的JPEG2000图像编解码方法,其特征在于,该方法包括下述步骤:
1)建立了基于视觉潜在注意力目标区域的JPEG2000图像编解码技术系统架构;通过视觉潜在注意力目标区域提取技术,计算视觉显著性注意力图,并对输入图像进行视觉潜在注意力目标区域分割,从而得到图像中若干个潜在注意力目标区域及其注意力系数,并在原始图像R、G、B三个图像分量中,划分为若干个对应的具有相同注意力系数的Tile块;
2)根据用户给定的压缩目标码率,并通过计算各Tile块间注意力系数比值,实现对每个Tile块的目标码率预分配;
3)根据视觉潜在注意力目标区域划分的Tile块经过DC位移、分量变换、自适应小波变换以及量化,得到每个Tile块在各级分辨率下量化后的小波系数;
4)通过基于视觉潜在注意力目标区域的Tile块小波系数区域索引技术,实现Tile块在各级分辨率下的Precinct索引结构;
5)通过位平面编码以及算术编码重置技术,实现对Precinct进行编码,记录候选失真度与编码码字长度;最后将编码结果、候选失真度以及对应的码字长度一起输出至下一过程;
6)通过构造Precinct质量层和基于Precinct质量层的码率控制技术,并根据步骤2)中预分配的目标码率、步骤4)中区域索引数组、各质量层码字长度,实施Precinct质量层码率控制形成截断码流以及打包,实现基于潜在注意力目标区域的图像编码;
7)依上述步骤的逆过程进行,即可获得按用户要求码率实现的基于视觉潜在注意力目标区域的图像解码与重构,从而获得反映视觉潜在注意力的重构图像。
2.根据权利要求1所述的基于视觉潜在注意力目标区域的JPEG2000图像编解码方法,其特征在于,所述视觉潜在注意力目标区域提取技术具体步骤如下:
1)利用自底向上视觉注意力空域计算模型,获得输入图像的视觉显著性注意力系数图;
2)在显著性注意力图中找具有最大系数的位置,从该注意力位置反向找到引起该位置注意力系数最大的特征层通道;
3)以该通道中最大注意力系数对应像素点为中心,并按四邻域进行区域增长,直到边界点系数值小于最大值的10%后停止;属于此区域的点置标记为1,不属于此区域的点置标记为0,由此得到一个二值模板,从而实现第一个Tile块的分割;
4)再将显著性注意力图中由步骤2)得到的第一个Tile块所对应区域的注意力系数都置为0,从而得到新的显著注意力图;
5)在新图中找与步骤2)相比的第二大注意力系数的位置,再重复步骤2)实现第二个Tile块的分割;
6)重复上述步骤直到显著性注意力图中注意力系数小于预先设定的阈值时,停止Tile块划分;
7)最后将剩余图像区域作为一个Tile块处理;
8)划分后的各Tile块图像在其R、G、B三个分量中都具有相同的划分和相同的注意力系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010597655.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种3D视频播放方法及系统
- 下一篇:一种激光电视机