[发明专利]基于一致性函数空间映射的图像联合分割算法在审
申请号: | 201510472107.0 | 申请日: | 2015-08-04 |
公开(公告)号: | CN105069787A | 公开(公告)日: | 2015-11-18 |
发明(设计)人: | 盛斌;田立武;张越青;蒋斌;王伟锋 | 申请(专利权)人: | 浙江慧谷信息技术有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 秦晓刚 |
地址: | 314200 浙江省嘉兴市平湖*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 一致性 函数 空间 映射 图像 联合 分割 算法 | ||
技术领域
本发明涉及一种图像分割领域的算法,具体是一种基于一致性函数空间映射的图像联合分割算法。
背景技术
图像分割技术是图像识别和计算机视觉至关重要的预处理。没有正确的分割就不可能有正确的识别。但是,如果进行分割仅有的依据是图像中像素的亮度及颜色,那么由计算机自动进行分割时,将会遇到各种因素的影响以致难以进行有效分割。例如,光照、噪声、图像模糊,以及阴影等因素。因此图像分割是需要进一步研究的技术。人们希望引入一些人为的知识导向和人工智能的方法,用于纠正某些分割中的错误,图像联合分割就是其中一种重要方法,它能够通过联系多张类似图片的信息来增强每张图片分割的准确度。
早先的图像联合分割算法主要通过比较每两张图片间的视觉特征,比如前景图像的颜色直方图,SIFT特征匹配,显著性检测,Gabor特征等,把图像联合分割问题转化为了聚类问题,使得聚类的结果前景与背景之间的距离最大。这些方法使用了区域匹配,通过建立场景间相似物体的关系从而利用到了图片间的信息来增强分割。S.Vicente等人在2011年CVPR上发表的文章”Objectcosegmentation”中提出在有监督的情况下,建立一个按照相似物体进行分割的库,并训练一个随机森林回归器来为每一对分割进行打分。尽管这些方法已经可以进行自动分割,然而当图片集包含不同的视角,光照和变形时,这些方法效果还不是很好。
函数空间映射是一种与图匹配相关的算法,主要用于物体分类和图像匹配上。A.Berg等人在2005年的CVPR上发表的”Shapematchingandobjectrecognitionusinglowdistortioncorrespondence”论文中使用了这一方法,把一张图片表示为图结构,图中的每一个顶点为图像中的一个区域。图的边则表示了图像中各区域的潜在空间结构,并且也被用来保证相邻区域再进行匹配时的几何一致性。然而图匹配问题是一个NP难问题,需要找到合适的算法来进行近似求解。
发明内容
本发明针对现有方法存在的不足,提出了一种基于一致性函数空间映射的图像联合分割方法。该方法利用一致性函数空间映射来表示一组图像间的一致性关系。一致性函数空间映射的基本思想是将每一幅图像用一个线性函数空间来表示,然后用两个线性空间的映射来表示这两个图像间的关系。这种函数表示法非常有用,因为图像的特征和分割都可以被看成是图像上的函数,并且特征之间的关系可以被看成是两个空间线性映射的一种线性约束。
为解决上述技术问题,本发明采用如下技术方案:基于一致性函数空间映射的图像联合分割算法,包括如下步骤:
第一步、使用超像素分割技术对图像进行超像素分割,分割出超像素块,这些超像素块是对图像的一种过分割;
第二步、为图的每两个节点建立带权值的边,这些边的权值表示了这两个超像素块的不相似性,使用每两个相邻超像素块相邻边的梯度之和作为权值;
第三步、为每一幅图像生成的图结构提取出一个线性空间,这个线性空间能够生成任意一个对图像进行分割的函数,从这个线性空间生成的分割函数中选出需要的分割函数,使用图结构的Laplacian矩阵的特征向量作为图像的函数空间;
第四步、提取每幅图像的gist特征,gist特征是全局特征,使用gist特征为所有需要分割特图像建立一个加权图,顶点是每一张图像,边是gist特征的距离;
第五步、提取一致性函数空间映射,需要建立优化模型求解,这一优化模型首先约束了两幅相似图像在经过函数空间映射后特征应该尽量相近,第二个约束是保证两幅相似图像的映射是一个对角矩阵,第三个约束保证了映射前后两幅相似图像的函数空间尽量相似;
第六步、求解上述优化模型,得到每两幅图像间的函数空间映射矩阵;
第七步、使用获得的映射矩阵建立优化模型,求解出函数空间上的一个函数,使得这个函数是对这个图结构的最优化分割。
优选的,第二步中:为图的每两个顶点建立带权值的边,使用分割掩模和邻接矩阵提取出图像中所有的相邻超像素块,使用Sobel掩模求得每两个相邻超像素块边界的梯度之和,这个值作为图结构的边的权值。
优选的,第三步中:为每一幅图像生成的图结构提取出一个线性空间是指:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江慧谷信息技术有限公司,未经浙江慧谷信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510472107.0/2.html,转载请声明来源钻瓜专利网。