[发明专利]基于脉冲余弦变换的选择性视觉注意计算模型无效

专利信息
申请号: 200910053224.8 申请日: 2009-06-17
公开(公告)号: CN101587590A 公开(公告)日: 2009-11-25
发明(设计)人: 余映;王斌;张立明 申请(专利权)人: 复旦大学
主分类号: G06T7/00 分类号: G06T7/00;G06T7/40;G06T7/20;G06F17/14
代理公司: 上海东亚专利商标代理有限公司 代理人: 董 梅;鲍良胜
地址: 20043*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 脉冲 余弦 变换 选择性 视觉 注意 计算 模型
【说明书】:

技术领域

发明属于图像和视频处理技术领域,具体为一种基于脉冲余弦变换的选择性视觉注意计算模型。利用该模型模拟人脑选择性视觉注意的产生机制,产生有效的视觉显著图,在空间上和时间上都可以很快地计算得到相应的视觉显著图,从而能够探测视觉场景中的空间显著性和运动显著性。在机器人导航,虚拟人系统,自动对焦系统等计算机视觉领域内有广泛的应用前景。

技术背景

人的视觉系统中存在一个基于场景显著性(Saliency-based)的自底向上(Bottom-up)的视觉注意机制,它使人眼能迅速注意到复杂场景中的显著目标。选择性视觉注意(Selective Visual Attention)是人脑视觉通路中信息处理的一个关键环节,它仅容许少部分感知信息进入短期记忆和视觉意识阶段。因此,人脑没有并行处理所有视觉感知信息,而是以串行方式进行信息处理[1]。

近期研究指出,初级视觉皮层(V1)中形成了自底向上的视觉显著性信息,响应最强烈神经元,其感受野对应的场景区域成为视觉注意焦点的可能性最大[2]。这种观点认为,视觉显著性的形成是同类神经元侧抑制作用的结果。Itti等人提出过一个在计算结构上具有生物学合理性的视觉注意模型[3]。其后,Walther将该模型进行功能扩展[4],并创建了图像显著性工具箱(Saliency Toolbox,STB),可生成决定注意焦点位置的视觉显著图(VisualSaliency Map)。然而,此类模型参数设置复杂,算法结果受到参数设置的影响较大,而且,计算复杂度高,运算十分耗时,难以应用到实时系统。此外,它们不能计算运动显著性。

Hou等人认为,单幅图像幅度谱和均值幅度谱的残差中蕴含了场景显著性信息[5],并提出计算视觉注意显著图的谱残差(Spectral Residual,SR)方法。Guo等人进一步提出相位谱四元数傅立叶变换(Phase Spectrum ofQuaternion Fourier Transform,PQFT)方法[6],利用傅氏变换的相位谱信息计算得到视觉注意的时空显著图。因为复数计算不可能在人脑中实现,所以此类方法的计算结构缺乏生物学合理性。

发明内容

本发明目的在于:提出一个既有优异的人眼视觉注意模拟性能,同时又能实时应用的基于脉冲余弦变换的选择性视觉注意计算模型。

本发明目的通过下述技术方案实现:本发明提出脉冲余弦变换(PulsedCosine Transform,PCT),并用它来模拟人脑视觉皮层同类神经元间的侧抑制过程,从而进一步产生有效的视觉显著性信息,脉冲余弦变换的选择性视觉注意计算模型(PCT视觉注意计算模型),具体步骤如下:

1、视觉显著图的计算:

给定输入图像M,视觉显著图的计算步骤为:

P=sign(C(M)),              (1)

F=abs(C1(P)),            (2)

SM=G*F2,                 (3)

其中,C和C-1分别表示DCT变换和它的逆变换,sign(.)为符号函数,abs(.)为取绝对值函数,G是二维高斯低通滤波器;其中,在(1)式中仅仅保留DCT系数的符号,丢弃了幅度信息;其二元化系数(即-1和1)模拟了人脑神经元的放电与否;将(1)式称为脉冲余弦变换(Pulsed Cosine Transform,PCT),此方法称为计算视觉显著图的PCT模型,最后,视觉显著图由(2)、(3)两式计算得到。输入图像首先要进行亚采样处理,处理后的图像尺寸决定了视觉注意的尺度。一般情况下可将输入图像均缩放到短边为64像素,长边则按照原图长宽比例进行相应调整。

由于PCT模型是从离散余弦变换(Discrete Cosine Transform,DCT)[7]变化而来,而DCT是一种被广泛运用且非常简单的酉变换方法。所以本发明模型结构简单,计算复杂度低,能够实时处理。

研究表明,诸如颜色、边缘轮廓和运动等基本视觉特征与视觉显著性的形成有着密切联系,它们的处理过程在视觉前注意期(Pre-attention)就已经存在[8]。根据该理论,本发明首先计算出它们对应的特征图,然后再将其整合起来。

彩色图像视觉显著图的计算:

假设r、g、b表示输入图像红、绿、蓝3个颜色的值,那么强度特征图的计算公式为:

MI=(r+g+b)/3.          (4)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910053224.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top