[发明专利]基于稀疏组群结构的图像标注方法有效
申请号: | 201010262568.2 | 申请日: | 2010-08-20 |
公开(公告)号: | CN102375855A | 公开(公告)日: | 2012-03-14 |
发明(设计)人: | 吴飞;庄越挺;袁莹 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 稀疏 结构 图像 标注 方法 | ||
1.一种基于稀疏组群结构的图像标注方法,其特征在于包括如下步骤:
1)对图像数据集进行特征提取;
2)对每个图像数据集选取n个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;
3)利用稀疏组群结构对图像进行特征选择;
4)利用图像标注单词之间的关系进一步优化标注结果。
2.根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的对图像数据集进行特征提取的步骤为:
1)对图像数据进行特征提取,特征包括全局特征和局部特征,全局特征包括颜色、纹理、形状,局部特征包括SIFT、形状上下文;
2)将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为(xi,yi)∈Rp×{0,1}C,其中xi=(xi1,...,xip)T∈Rp表示图像的特征向量,p表示特征维数,yi=(yi1,...,yiC)T∈{0,1}C是相应的标注向量,C表示数据集的标注单词总数,yij=1表示第i幅图像有第j个标注,否则,yij=0,假设从图像数据中提取G类特征,dg表示第g类特征的维数,g∈{1,...,G},那么图像的特征向量重新表示为
3.根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的利用稀疏组群结构对图像进行特征选择的步骤为:
1)对每个标注单词c(c∈{1,...,C}),训练回归模型fc,训练模型包括一个逻辑损失函数和一个正则化项:其中λ是一个可调节的参数,是截距项,表示对应第g类异构特征的参数向量;
2)通过迭代求解上述最优化问题,得到参数向量β,图像特征选择结果为
4.根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为:
1)假设给定n个有标注单词的图像样例,X=(x1,x2,...,xn)∈Rp×n,Y=(y1,y2,...,yn)∈Rc×n,分别表示图像的特征向量和标注单词向量;
2)运用典型相关分析选择向量wx和wy使X和Y之间相关性最大,即求解以下最优化问题:
解得相关向量wx和wy;
3)优化的标注结果,其中是前一步通过回归模型解得的,B=T-1DT,T是一个C×C的矩阵,其中的每一行是运用典型相关分析得到的典型相关坐标,即D是一个C×C的对角矩阵D=diag(d1,d2,...,dC),其对角线上的元素通过典型相关分析以后的X和Y的协方差得到:
其中k=1,2,...,C,γ=p/n。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010262568.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种头像相框的生成方法和系统
- 下一篇:可动光学元件调节驱动装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序