[发明专利]基于稀疏组群结构的图像标注方法有效
申请号: | 201010262568.2 | 申请日: | 2010-08-20 |
公开(公告)号: | CN102375855A | 公开(公告)日: | 2012-03-14 |
发明(设计)人: | 吴飞;庄越挺;袁莹 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 稀疏 结构 图像 标注 方法 | ||
技术领域
本发明涉及一种基于稀疏组群结构的图像标注的方法。该方法利用稀疏组群结构进行特征选择,结合标注单词间的相关性学习来对图像进行标注。
背景技术
随着图像特征提取技术的日益成熟,可以提取的异构特征越来越多,它们可以用来描述图像视觉特征的多个方面,例如全局特征(颜色、纹理)和局部特征(SIFT、形状上下文、GLOH(梯度位置和方向直方图))。虽然可从图像中提取众多异构特征,但是不同异构特征有着不同的内在表达能力。也就是说,若干种类异构特征的组合可充分表达图像某一语义,而不是所有异构特征全部组合起来表达图像某一语义,后者将会引入过多无关特征或噪音,影响图像语义的精确表达。
因此,在图像标注过程中,对于给定的图像标注单词,将会只有有限种异构特征可以用来表达这一标注单词,对某个图像语义来说,所选择的异构特征因此往往是比较稀疏的。
近年来,lasso(least absolution shrinkage and selection operator)这一思想被提出,借助于其所具有的变量选择特性,一些在lasso基础上进行图像特征稀疏性选择的方法被提出。但是,图像的视觉特征具有明显的组群结构,不同类别的视觉特征具有不同的视觉特性。如果在图像标注中能够充分利用这种组群结构,构造相应异构特征的选择机制,将会促进图像标注结果的“可解释性”。
在传统图像多标注处理过程中,一般会对每个标注单词构建一个独立的回归模型而预测标注结果,这种方法没有考虑到标注单词之间的相关性,影响了标注结果。为了将标注间的相关性考虑进来,一些算法利用了典型相关分析或者共享结构来更好的学习多标注间的关联。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于稀疏组群结构的图像标注方法。
基于稀疏组群结构的图像标注方法包括如下步骤:
1)对图像数据集进行特征提取;
2)对每个图像数据集选取n个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;
3)利用稀疏组群结构对图像进行特征选择;
4)利用图像标注单词之间的关系进一步优化标注结果。
所述的对图像数据集进行特征提取的步骤为:
1)对图像数据进行特征提取,特征包括全局特征和局部特征,全局特征包括颜色、纹理、形状,局部特征包括SIFT、形状上下文;
2)将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为(xi,yi)∈Rp×{0,1}C,其中xi=(xi1,...,xip)T∈Rp表示图像的特征向量,p表示特征维数,yi=(yi1,...,yiC)T∈{0,1}C是相应的标注向量,C表示数据集的标注单词总数,yij=1表示第i幅图像有第j个标注,否则,yij=0,假设从图像数据中提取G类特征,dg表示第g类特征的维数,g∈{1,...,G},那么图像的特征向量重新表示为
所述的利用稀疏组群结构对图像进行特征选择的步骤为:
1)对每个标注单词c(c∈{1,...,C}),训练回归模型fc,训练模型包括一个逻辑损失函数和一个正则化项:其中λ是一个可调节的参数,是截距项,表示对应第g类异构特征的参数向量;
2)通过迭代求解上述最优化问题,得到参数向量β,图像特征选择结果为
所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为:
1)假设给定n个有标注单词的图像样例,X=(x1,x2,...,xn)∈Rp×n,Y=(y1,y2,...,yn)∈Rc×n,分别表示图像的特征向量和标注单词向量;
2)运用典型相关分析选择向量wx和wy使X和Y之间相关性最大,即求解以下最优化问题:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010262568.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种头像相框的生成方法和系统
- 下一篇:可动光学元件调节驱动装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序