[发明专利]一种联合多种上下文线索的图像关注区域检测方法有效
申请号: | 201510178878.9 | 申请日: | 2015-04-16 |
公开(公告)号: | CN104778466B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 李甲;陈小武;赵沁平;夏长群 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京科迪生专利代理有限责任公司11251 | 代理人: | 杨学明,贾玉忠 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联合 多种 上下文 线索 图像 关注 区域 检测 方法 | ||
技术领域
本发明涉及计算机视觉关注和图像场景理解领域,具体地说是联合多种上下文线索的图像关注区域检测方法。
背景技术
图像显著性计算是计算机视觉领域中一个基本且重要的研究问题。目前,国内外关于视觉显著计算的研究主要集中在探索人类视知觉系统如何对输入的海量视觉信息进行选择性处理。从信号处理的认知角度看,自然场景中没有什么元素是全新的。在日常生活中,常常有很高刺激信号但是非常常见熟悉的对象或者区域,在人类视觉系统中,这些对象或者区域会被在认识早期阶段就被过滤掉,或是因为图像内部特征线索,或是因为图像外部特征线索。在这种方式下,只有最显著的图像对象或者区域会最终进入到人类的大脑中进行信息处理。视觉注意力选择机制是对人类认识、分析和理解真实世界的最重要的一种机制。
在过去二十年,模拟视觉注意力选择机制成为计算机领域中一个非常重要的热门研究点。各式各样的显著性模型在很多文献中被发表。总的来说,这些研究的主要目的是在图像视频中有效的计算出最显著的视觉元素。在计算过程中,大多数都接受这样一个前提,即独特罕见的视觉元素是视觉显著的。在这种前提下,很多显著模型都衡量视觉元素块的独特性和不规则性。1998年,Itti采用对比度的方式来计算视觉不规则员。2005年Hu采用纹理差异来衡量不同视觉元素的显著性。在2009年,Gao引入交互信息计算显著性。这些模型在只结合图像内部线索可以计算出不错的显著结果。
但现在有一个越来越有挑战性的问题,即在图像中存在一些干扰视觉元素,这些干扰视觉元素在视觉系统中并不是显著的,但却拥有和显著视觉元素相同的视觉属性。若用经典的显著计算模型来计算这类图像的显著性时,常常会误将干扰视觉元素认为是显著的。针对该问题有一个常用的客服办法,用监督的学习方法对已经标注好的图像集进行训练,使训练得到的模型可以更强调图像内部显著的视觉元素。但是这类方法常常会出现过拟合的错误结果,因为用户标注的图像训练是常常是有限的,不能涵括到经常出现的显著性目标。通过仔细观测图像训练集,我们发现干扰对象在图像集中经常出现,而显著对象在这些图像集中是经常变换,也就是说显著目标比干扰视觉元素有更大的变动性。
发明内容
根据上述需求,为了克服现有技术的不足,本发明的目的在于:提供联合多种上下文线索的图像关注区域检测方法,该方法通过模拟人类视觉系统的相关机制来实现对图像场景的视觉显著性计算。为完成发明目的,本发明采用的技术方案是:联合多种上下文线索的图像关注区域检测方法,该方法包含以下步骤:
步骤(1)构造出大规模图像数据集,该数据集应涵括多种图像场景类别,并对图像数据集进行预处理;
步骤(2)利用层次聚类算法,判别数据集中的场景类别,构建出树状结构的层次化上下文模型;
步骤(3)对图像内部上下文线索进行处理,得到图像的颜色特征、对比度特征、位置特征等内部特征;
步骤(4)构建混合高斯模型,用于表征指定图像场景中类别对象及其位置关系的先验知识,用作图像外部上下文特征;
步骤(5)利用图像内部特征,结合图像内部上下文线索,检测图像内部视觉刺激信号;
步骤(6)充分考虑相同类别图像场景的上下文信息,利用混合高斯模型,结合图像外部上下文线索,检测外部图像视觉刺激信号;
步骤(7)联合图像内部、外部上下文线索检测到的刺激信号,并用马尔可夫链机制构建视觉刺激信号驱动的图像显著性估计。
进一步的,所述大规模图像数据集为确保涵盖多种类型的图像场景,在互联网上图片网站上用大量的关键词进行搜集;得到初始数据集之后,删去重复内容的图像,并移除不符合尺寸大小要求的图像,从而确保构造出尽可能多的涵盖日常生活常见的图像场景类型的大规模图像数据集。此外,为方便后续过程对图像的处理,该数据集所有图像的大小进行归一化。
判别数据集中场景类别,首先用GIST描述符来表征数据集图像,使用层次聚类算法建立一个树状结构,一开始将所有的图像归为同一类图像场景,然后逐步将他们划分为更小的单元,在迭代过程中对划分过程定义一个松散度,当松散度最小的那个类的结果都小于一个阈值,则认为划分可以终止,最终产生层次聚类的树结构。该树结构的每一个叶子节点都代表一类指定的图像场景,并为每一个指定的叶子节点构建一个混合高斯模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510178878.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸表情特征提取方法
- 下一篇:一种基于网格单元特征的人群聚集行为检测方法