[发明专利]一种目标搜索方法有效

申请号：	201110271232.7	申请日：	2011-09-14
公开（公告）号：	CN102339393A	公开（公告）日：	2012-02-01
发明（设计）人：	李永杰;何琦;李朝义	申请（专利权）人：	电子科技大学
主分类号：	G06K9/66	分类号：	G06K9/66
代理公司：	电子科技大学专利中心 51203	代理人：	周永宏
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种目标搜索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于计算机视觉技术领域，特别涉及一种目标搜索方法。

背景技术

科学技术的不断发展使得各类信息量急剧增长，如何使计算机有效地处理多媒体信息，从中获取需要的信息是亟待解决的问题。而人眼能够对进入视网膜的海量信息很快做出反应，因此希望能够模拟人类的视觉处理机制从大量、冗余的复杂场景数字图像数据中快速、准确地获取我们寻找的目标区域，提高数字图像处理的效率和准确性。1998年Itti和Koch等人提出了一种自底向上的选择性注意模型——Itti模型，具体可参见文献：L.Itti，C.Koch.E.Niebur.A model of saliency-based visual attention for rapid scene analysis.Pattern Analysis and Machine Intelligence，IEEE Transactions on，1998，20(11)：1254-1259.这种方法充分利用了滤波器的思想并且模拟了视觉生理机制中的感受野的中央外周机制机返回抑制机制，形成了一个拟生理结构的计算模型。从整体来说，它基本完成了对初期视觉注意机制的建模，对于研究生理意义上的视觉选择性注意机制有重要的意义。但是用该模型仅利用了图像本身的信息，忽略了搜索任务对人眼的调制，因此对目标显著区域的检测准确性低。在文献：Antonio Torralba，Aude Oliva，Monica S.Castelhano.Contextual Guidance of Eye Movement and Attention in Real-World Scenes：The Role ofGlobal Features in Object Search.Psychological Review，2006，Vol.113，No.4，766-786，提出了一种采用高斯滤波获取图像全局信息的计算方法，通过学习获取图像全局信息与目标坐标的分布函数，同时采用指数分布函数模拟图像局部信息的分布，结合两个分布函数之积获取人眼的注视位置。但是该模型计算全局信息的过程中忽略了人眼在获取图像全局信息中的多尺度特性，不符合人眼在图像中的目标搜索过程，没有准确地同局部信息结合。

发明内容

本发明的目的是为了解决现有的注意模型对复杂场景中目标搜索时存在的缺陷，提出了一种目标搜索方法。

本发明的技术方案是：一种目标搜索方法，包括对训练图像进行训练的步骤和对目标图像进行搜索的步骤，其中，对训练图像进行训练的步骤具体包括如下分步骤：

S1.小波变换：对训练图像进行小波变换，分别获得每个训练图像的高频成分矩阵和低频成分矩阵；

S2.高斯滤波：分别对每个训练图像高频成分矩阵和低频成分矩阵进行高斯滤波得到每个训练图像的高频全局特征和低频全局特征；

S3.主分量提取：采用PCA算法分别提取训练图像的高频全局特征和低频全局特征的主分量；

S4.确定分布函数：从训练图像中选取若干个图像，利用步骤S3得到的高频全局特征和低频全局特征的主分量与若干个图像的目标坐标，通过EM算法学习得到混合高斯函数的参数，确定分布函数。

对目标图像进行搜索的步骤具体包括如下分步骤：

S5.提取全局特征向量：对目标图像进行小波变换，分别获得目标图像的高频成分矩阵和低频成分矩阵；对获得的高频成分矩阵和低频成分矩阵进行高斯滤波得到目标图像的高频全局特征和低频全局特征；将得到的高频全局特征和低频全局特征分别映射到步骤S3得到的高频全局特征和低频全局特征的主分量，获得高频全局特征向量和低频全局特征向量；

S6.获取目标分布图像：分别将步骤S5得到的高频全局特征向量和目标图像的坐标矩阵以及步骤S5得到的低频全局特征向量和目标图像的坐标矩阵输入到步骤S4得到的分布函数，确定高频分布矩阵和低频分布矩阵，将高频分布矩阵和低频分布矩阵进行叠加得到分布矩阵，将分布矩阵与目标图相乘得到目标分布图像；

S7.特征提取：从步骤S6得到的目标分布图像提取两个颜色特征金字塔，强度特征金字塔以及四个方向特征金字塔；

S8.特征叠加：对步骤S7得到的7个特征金字塔分别进行中央-周边操作和规范化，得到7个子特征金字塔，分别对颜色，强度，方向的特征金字塔进行叠加，得到3个特征图，对得到的3个特征图进行规范化，然后对规范化后的3个特征图进行叠加，得到一幅显著图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110271232.7/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种目标搜索方法有效

专利文献下载