[发明专利]基于子模优化的物体识别方法有效
申请号: | 201410270916.9 | 申请日: | 2014-06-17 |
公开(公告)号: | CN104063685B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 邵岭;朱凡;江卓林 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 刘谦,朱小兵 |
地址: | 215101 江苏省苏州市吴中区木*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 子模 优化 物体 识别 方法 | ||
技术领域
本发明涉及防伪技术领域,特别涉及一种基于子模优化的物体识别方法。
背景技术
几年来,词袋(BoF)模型及其扩展版本金字塔匹配模型(SPM)在物体识别领域十分流行。当同密集采样的金字塔网格和强大的分类器组合在一起时BoF和SPM模型在许多物体识别基准数据库上取得了很优秀的结果。这些数据库包括PASCAL VOC2007,Caltech-101,ETHZ-shape等等。这些密集采样的网格能够保留一个物体类别的上下文信息,比如空间布局,然而,不相关的背景信息也同时被保留了。为了解决这个问题,很多之前的方法试图利用图像分割的结果来增强物体识别的识别率。协同图像分割的识别能够带来以下两方面好处:1)准确的图像分割结果能够增强物体的边界对比度,所以沿着边界的特征能包括更多的形状信息。2)在同质的图像片段上计算特征能增强信噪比。但是,由于缺少可信任的图像分割方法,基于图像分割的物体识别没有太大的进展。以Nilsback和Zisserman基于图像分割所进行的花的识别作为例子。由于一幅图像中只有考虑单一的片段,较准确的分割结果可以在一副图像的背景很简单的情况下获得。可是,其方法所得到的结果与不基于图像分割的分类结果相比提高并不明显。在最近的基于底层的物体识别方法中,很多方法试图利用物体的空间分布来获得更好的性能。
He等人(参见文献“X.He,R.S.Zemel,and M.A.Carreira-Perpin′an.Multiscale conditional random fields for image labeling.In IEEE Conference on Computer Vision and Pattern Recognition,volume2,pages II–695.IEEE,2004.”)在图像像素上建立了一个条件随机场(CRF)框架来为每个像素分配一个有限标签集合中的标签。这样一来,图像特征和图像标签都被包括到一个概率框架中。Shotton等人(参见文献“J.Shotton,J.Winn,C.Rother,and A.Criminisi.Textonboost for image understanding:Multi-class object recognition and segmentation by jointly modelling texture,layout,and context.International Journal of Computer Vision,81(1):2–23,2009.”)提出了Textonboost的方法来结合纹理、分布和上下文信息到一元分类问题中。通过结合一元分类到CRF中,本发明捕捉相邻像素间的类别标签的空间互动来保证数据的光滑性。基于像素层面方法的一个重大限制是在分割相近同类别物体时所表现出的不足。Gould等人(参见文献“S.Gould,R.Fulton,and D.Koller.Decomposing a scene into geometric and semantically consistent regions.In IEEE International Conference on Computer Vision,pages1–8.IEEE,2009.”)和Ladicky等人(参见文献“L.Ladicky,C.Russell,P.Kohli,and P.H.Torr.Associative hierarchical crfs for object class image segmentation.In IEEE International Conference on Computer Vision,pages739–746.IEEE,2009.”)使用矩形的包围区域检测限制来解决这一问题。同使用包围区域的方法相比较而言,基于图像片段或者图像像素的方法更接近于真实的物体空间区域。Fulkerson等人(参见文献“B.Fulkerson,A.Vedaldi,and S.Soatto.Class segmentation and object localization with superpixel neighborhoods.In IEEE International Conference on Computer Vision,pages670–677.IEEE,2009.”)在识别框架中利用超像素作为基本单元。在此方面,分类器是在每个超像素中的局部特征的灰度图的基础上构造的,并且利用与该超像素距离相近的超像素灰度图的和作为正则化项。对于基于图像片段的识别方法,Rabinovich等人(参见文献“A.Rabinovich,S.Belongie,T.Lange,and J.M.Buhmann.Model order selection and cue combination for image segmentation.In IEEE Conference on Computer Vision and Pattern Recognition,volume1,pages1130–1137.IEEE,2006.”)利用稳定启发式来从由归一化的图割所获得的图像分割结果中选择减少样本(参见文献“J.Shi and J.Malik.Normalized cuts and image segmentation.Pattern Analysis and Machine Intelligence,IEEE Transactions on,22(8):888–905,2000.”)。对于一幅图像,在所获得的列表中的每个图像片段被当作是一副独立的图像,同时这些图像片段的标签将对图像的类别进行投票。相比于用一个单一图像片段进行物体识别而言,利用图像片段的集合可以捕捉更多的物体边界信息。不过,他们没有提供一个可靠地图像片段选择机制来排除掉偏差较大的片段,并且把整个图像片段的集合作为一个新的图像集合需要巨大的计算量。Li等人(参见文献“F.Li,J.Carreira,and C.Sminchisescu.Object recognition as ranking holistic figure-ground hypotheses.In IEEE Conference on Computer Vision and Pattern Recognition,pages1712–1719.IEEE,2010.”)介绍了一个与本发明将要提出的工作相类似的基于CPMC算法生成的多个底层图像分割结果的物体识别框架。不过,本发明提供的方法和他们的方法在如何选择简洁的并且具有判别性的底层图像片段上有很大的不同。本发明利用一个基于子模性质的常数因子的近似,而不是特设的去选取底层图像片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410270916.9/2.html,转载请声明来源钻瓜专利网。