[发明专利]基于脉冲余弦变换的选择性视觉注意计算模型无效
申请号: | 200910053224.8 | 申请日: | 2009-06-17 |
公开(公告)号: | CN101587590A | 公开(公告)日: | 2009-11-25 |
发明(设计)人: | 余映;王斌;张立明 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/40;G06T7/20;G06F17/14 |
代理公司: | 上海东亚专利商标代理有限公司 | 代理人: | 董 梅;鲍良胜 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 脉冲 余弦 变换 选择性 视觉 注意 计算 模型 | ||
技术领域
本发明属于图像和视频处理技术领域,具体为一种基于脉冲余弦变换的选择性视觉注意计算模型。利用该模型模拟人脑选择性视觉注意的产生机制,产生有效的视觉显著图,在空间上和时间上都可以很快地计算得到相应的视觉显著图,从而能够探测视觉场景中的空间显著性和运动显著性。在机器人导航,虚拟人系统,自动对焦系统等计算机视觉领域内有广泛的应用前景。
技术背景
人的视觉系统中存在一个基于场景显著性(Saliency-based)的自底向上(Bottom-up)的视觉注意机制,它使人眼能迅速注意到复杂场景中的显著目标。选择性视觉注意(Selective Visual Attention)是人脑视觉通路中信息处理的一个关键环节,它仅容许少部分感知信息进入短期记忆和视觉意识阶段。因此,人脑没有并行处理所有视觉感知信息,而是以串行方式进行信息处理[1]。
近期研究指出,初级视觉皮层(V1)中形成了自底向上的视觉显著性信息,响应最强烈神经元,其感受野对应的场景区域成为视觉注意焦点的可能性最大[2]。这种观点认为,视觉显著性的形成是同类神经元侧抑制作用的结果。Itti等人提出过一个在计算结构上具有生物学合理性的视觉注意模型[3]。其后,Walther将该模型进行功能扩展[4],并创建了图像显著性工具箱(Saliency Toolbox,STB),可生成决定注意焦点位置的视觉显著图(VisualSaliency Map)。然而,此类模型参数设置复杂,算法结果受到参数设置的影响较大,而且,计算复杂度高,运算十分耗时,难以应用到实时系统。此外,它们不能计算运动显著性。
Hou等人认为,单幅图像幅度谱和均值幅度谱的残差中蕴含了场景显著性信息[5],并提出计算视觉注意显著图的谱残差(Spectral Residual,SR)方法。Guo等人进一步提出相位谱四元数傅立叶变换(Phase Spectrum ofQuaternion Fourier Transform,PQFT)方法[6],利用傅氏变换的相位谱信息计算得到视觉注意的时空显著图。因为复数计算不可能在人脑中实现,所以此类方法的计算结构缺乏生物学合理性。
发明内容
本发明目的在于:提出一个既有优异的人眼视觉注意模拟性能,同时又能实时应用的基于脉冲余弦变换的选择性视觉注意计算模型。
本发明目的通过下述技术方案实现:本发明提出脉冲余弦变换(PulsedCosine Transform,PCT),并用它来模拟人脑视觉皮层同类神经元间的侧抑制过程,从而进一步产生有效的视觉显著性信息,脉冲余弦变换的选择性视觉注意计算模型(PCT视觉注意计算模型),具体步骤如下:
1、视觉显著图的计算:
给定输入图像M,视觉显著图的计算步骤为:
P=sign(C(M)), (1)
F=abs(C1(P)), (2)
SM=G*F2, (3)
其中,C和C-1分别表示DCT变换和它的逆变换,sign(.)为符号函数,abs(.)为取绝对值函数,G是二维高斯低通滤波器;其中,在(1)式中仅仅保留DCT系数的符号,丢弃了幅度信息;其二元化系数(即-1和1)模拟了人脑神经元的放电与否;将(1)式称为脉冲余弦变换(Pulsed Cosine Transform,PCT),此方法称为计算视觉显著图的PCT模型,最后,视觉显著图由(2)、(3)两式计算得到。输入图像首先要进行亚采样处理,处理后的图像尺寸决定了视觉注意的尺度。一般情况下可将输入图像均缩放到短边为64像素,长边则按照原图长宽比例进行相应调整。
由于PCT模型是从离散余弦变换(Discrete Cosine Transform,DCT)[7]变化而来,而DCT是一种被广泛运用且非常简单的酉变换方法。所以本发明模型结构简单,计算复杂度低,能够实时处理。
研究表明,诸如颜色、边缘轮廓和运动等基本视觉特征与视觉显著性的形成有着密切联系,它们的处理过程在视觉前注意期(Pre-attention)就已经存在[8]。根据该理论,本发明首先计算出它们对应的特征图,然后再将其整合起来。
彩色图像视觉显著图的计算:
假设r、g、b表示输入图像红、绿、蓝3个颜色的值,那么强度特征图的计算公式为:
MI=(r+g+b)/3. (4)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910053224.8/2.html,转载请声明来源钻瓜专利网。