[发明专利]一种基于回归模型的图像集合建模与匹配方法有效
申请号: | 201210076886.9 | 申请日: | 2012-03-21 |
公开(公告)号: | CN102663418A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 王瑞平;戴琼海 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 回归 模型 图像 集合 建模 匹配 方法 | ||
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种基于回归模型的图像集合的建模与匹配方法。
背景技术
长期以来,物体分类是计算机视觉研究中的一项重要课题,分类器的训练和测试通常都是基于物体的单个或者很少量的样本进行的。随着摄像机和大容量存储设备等硬件技术的普及发展,在很多新的应用场景,例如视频监控、视频检索等任务中,可以获取到物体的大量图像数据,从而为后端分类问题的训练和测试阶段提供大量的样本,这些样本通常以图像集合的模式进行建模表示。在这类识别问题中,每个集合通常包含属于同一个物体类别的多个图像样本,这些图像样本涵盖了物体广泛的表观变化模式,比如姿态视角的变化、非刚性变形、光照变化等等。
基于图像集合的分类问题的难点在于,如何有效地刻画与建模集合中多幅图像的分布,并根据所建的模型综合利用多样本提供的信息。近年来,典型的做法主要有两类,即分别从参数式与非参数式两个角度对图像集合建模,前者通常利用概率分布函数来表示图像集合的样本分布,进而采用诸如K-L散度之类的度量来计算两个概率分布函数之间的相似度。后者则根据图像集合中样本的本质变化模式将其建模为线性子空间或者更为一般的非线性流形,基于这种建模方式,集合匹配分类的问题就可以转化为子空间或者流形匹配的问题,从而采用子空间或者流形上的各种可能的相似性度量函数与匹配策略进行分类。总体而言,当前采用的这两类集合建模方法都对图像集合中样本分布的形式有一定程度的假设,而在实际问题中集合样本的来源通常是多种多样的,当与模型所假设的样本分布形式差别较大时,分类效果就会有很大的偏差。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于回归模型的图像集合的建模与匹配方法。
为了实现本发明的上述目的,本发明提供了一种基于回归模型的图像集合建模与匹配方法,其包括如下步骤:
S1:组织训练图像集合;
S2:建立特征-类别回归模型;
S3:对测试图像集合进行投影;
S4:对测试图像集合进行分类。
本发明针对具有任意样本分布形式的图像集合,采用样本特征与相应的类别标记学习双线性回归模型,建立起集合样本与其类别之间的本质语义关联;针对未知类别标记的集合,只需将其每个样本进行线性回归然后综合各样本的类别响应即可得到整体集合的类别输出。该方法直观高效,计算简便,其对集合样本的分布形式和集合样本的规模均无任何先验假设,对集合中可能存在的噪声数据具有很好的容忍性。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明基于回归模型的图像集合建模与匹配方法的流程图;
图2为本发明所采用的偏最小二乘回归方法的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提供了一种基于回归模型的图像集合建模与匹配方法,如图1所示,其包括如下步骤:
S1:组织训练图像集合;
S2:建立特征-类别回归模型;
S3:对测试图像集合进行投影;
S4:对测试图像集合进行分类。
本发明组织训练图像集合的方法为:给定m个带有类别标签的训练图像集合,分别构造用于存放观察样本特征表示向量的预测矩阵X和用于存放观察样本类别指示向量的响应矩阵Y,其中,m为大于1的正整数。预测矩阵X的每一行对应一个观察样本的特征表示向量,该特征表示向量可以是但不限于图像灰度特征、小波特征。响应矩阵Y的每一行对应一个观察样本的类别属性指示向量。具体地,假设给定的类别数为c,那么响应矩阵Y的每一行为c维的类别指示向量,如果一个类别指示向量的第j个元素为1,其余元素全为0,即为[0,...,1,...,0],则表明当前观察样本属于第j类,其中,c为大于1的正整数,j为小于或等于c的正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210076886.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序