[发明专利]基于FCN与低秩稀疏分解的感兴趣区域检测方法有效
申请号: | 201710963435.X | 申请日: | 2017-10-13 |
公开(公告)号: | CN107977661B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 张芳;肖志涛;王萌;吴骏;耿磊;王雯;刘彦北 | 申请(专利权)人: | 天津工业大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/762;G06V10/77;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300387 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 fcn 稀疏 分解 感兴趣 区域 检测 方法 | ||
本发明公开了基于FCN与低秩稀疏分解的感兴趣区域检测方法,包括:1)对原图像进行超像素聚类,并提取每个超像素的颜色、纹理和边缘特征,据此构成特征矩阵;2)在MSRA数据库中,基于梯度下降法学习得到特征变换矩阵;3)在MSRA数据库中,利用全卷积神经网络学习得到高层语义先验知识;4)利用特征变换矩阵和高层语义先验知识矩阵对特征矩阵进行变换;5)利用鲁棒主成分分析算法对变换后的矩阵进行低秩稀疏分解,并根据分解得到的稀疏噪声计算显著图。本发明作为图像预处理过程,可以被广泛的应用到视觉跟踪、图像分类、图像分割和目标重定位等视觉工作领域。
技术领域
本发明涉及基于FCN与低秩稀疏分解的感兴趣区域检测方法,该方法对与背景对比度不同、背景复杂度不同的感兴趣区域以及不同面积的感兴趣区域的图像都具有很好的检测效果,本发明作为图像预处理过程,可以被广泛的应用到视觉跟踪、图像分类、图像分割和目标重定位等视觉工作领域。
背景技术
随着信息科技的快速发展与推广,图像数据成为人类重要的信息来源之一,人们所接收的信息量呈指数级增长。如何在海量的图像信息中筛选出人类感兴趣的目标区域具有重要研究意义。研究发现,在复杂场景下,人类视觉处理系统会将视觉注意力集中于该场景的少数几个对象,也称为感兴趣区域。感兴趣区域与人类视觉感知关系较为密切,具有一定的主观性。感兴趣区域检测作为图像预处理过程,可以被广泛的应用到视觉跟踪、图像分类、图像分割和目标重定位等视觉工作领域。
感兴趣区域检测方法分为自上而下和自下而上两种。自上而下的检测方法[1,2,3]是任务驱动型的,需要人工标注真值图进行监督训练,融入更多的人类感知(例如中心先验信息、色彩先验信息和语义先验信息等等)得到显著图。而自下而上的方法[4-12]是数据驱动型,更注重利用对比度、位置和纹理等图像特征得到显著图。最早的研究者Itti等人[4]提出一种基于局部对比度的空间域视觉模型,使用由中心向四周变化的图像差异性得到显著图。Hou等人[5]提出了基于谱残差的SR算法。Achanta等人[6]提出基于图像频域计算显著度的FT算法。Cheng等人[7]提出了基于直方图计算全局对比度的方法。Perazzi等人[8]引进了一种将显著性检测看作滤波的思想,提出了saliency filters(SF)方法。Goferman等人[9]提出了基于上下文感知的CA算法。Jiang等人[10]提出基于吸收马尔科夫链的MC算法。Yang等人先后提出基于凸包中心和图形正则化的GR算法[11]和基于流行排序的MR算法[12]。此外,低秩矩阵恢复作为高维数据分析及处理的工具被应用到显著性检测中[13-15]。Yan等人[13]提出将图像显著区域看作是稀疏噪声,将背景看作是低秩矩阵,利用稀疏表示和鲁棒主成分分析算法计算图像的显著性。该算法首先将图像分解成的小块,对每个图像块进行稀疏编码并合并成一个编码矩阵;然后利用鲁棒主成分分析分解编码矩阵;最后利用分解得到的稀疏矩阵构建相应图像块的显著性因子。但是,由于大尺寸的显著目标包含很多图像块,每个图像块中的显著目标不再满足稀疏特性,因而极大地影响了检测效果。Lang等人[14]提出多任务低秩恢复的显著性检测算法,利用多任务低秩表示算法分解特征矩阵,并约束同一图像块中所有特征稀疏成分的一致性,然后采用重构误差构建相应图像块的显著性。该算法充分利用多特征描述的一致性信息,效果比文献[13]有所提升,但由于大尺寸的目标包含大量的特征描述,此时特征不再具有稀疏特性,仅仅利用重构误差不能解决这一问题,故该方法同样不能完整的检测出大尺寸的显著性目标。为了改善低秩矩阵恢复的结果,Shen等人[15]提出一种融合高层次和低层次信息的低秩矩阵恢复检测算法(LRMR),这是一种自下而上与自上而下结合的算法。该算法改进了文献[18]中的不足,首先将图像进行超像素分割,并提取超像素的多个特征;然后通过学习得到特征变换矩阵和先验知识,包括中心先验、人脸先验和色彩先验,再利用学习得到的特征变换矩阵和先验知识对特征矩阵进行变换;最后利用鲁棒主成分分析算法对变换后的矩阵进行低秩与稀疏分解。该方法在一定程度上盖上了文献[13]和[14]的不足,但是由于中心先验存在一定的局限性,而在复杂场景下色彩先验也会失效,因此该算法对背景较复杂的图像检测效果不理想。受文献[15]的启发,本发明利用基于全卷积神经网络学习得到的高层语义先验知识替换文献[15]中的中心先验、人脸先验和色彩先验知识,并将其融入到低秩稀疏分解中,提高了算法在复杂场景下的检测感兴趣区域的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津工业大学,未经天津工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963435.X/2.html,转载请声明来源钻瓜专利网。