[发明专利]基于图像稀疏表示的抠图方法有效
申请号: | 201910917074.4 | 申请日: | 2019-09-26 |
公开(公告)号: | CN110766695B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 华臻;李小玲;李晋江 | 申请(专利权)人: | 山东工商学院 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06V10/762;G06V10/772 |
代理公司: | 淄博市众朗知识产权代理事务所(特殊普通合伙) 37316 | 代理人: | 程强强 |
地址: | 264005 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 稀疏 表示 方法 | ||
本文提出了一种基于稀疏表示的图像抠图算法,通过稀疏表示的方法构建matting图和ground truth间的稀疏关联,将它们统一到一个稀疏字典中,实现相同的稀疏表示。该方法首先构建matting图的稀疏表达字典,将图像的matting图与对应ground truth作为训练样本,从而构建出一个超完备字典。利用梯度信息提取图像特征,matting图像选择一阶和二阶梯度信息作为特征,ground truth图像选择高频分量作为图像块的特征。对KNN算法得到的matting图像,利用训练所得的稀疏字典对matting图重构来进行优化。通过定性和定量方式对实验结果进行评估,实验结果证明本文取得不错的抠图效果,通过稀疏重构的matting结果更接近ground truth。
技术领域
本发明涉及图像处理邻域,具体涉及一种基于图像稀疏表示的抠图方法。
背景技术
图像抠图问题与图像分割问题相似,但也有所不同。此两者都属于前景提取技术,二者的相同点是其目的都是将前景物体从一幅图像中提取出来。二者的区别是图像分割只是将图像划分成更易于理解和分析的形式,得到的结果可能是多个图像块或若干边缘轮廓的集合。图像分割中没有半透明的像素,每个像素的alpha值为0或1。抠图则认为前景物体的边缘是模糊的,存在半透明的像素点,其alpha值可以为[0,1]中的任意值。在前景物体的边缘处理上,图像抠图要精细很多,特别是对于细微部分,或者半透明的前景物体的处理。
图像中每一点的颜色都可以建模为前景颜色和背景颜色的线性组合:
I=αF+(1-α)B (1)
其中为透明度遮罩。此方程奠定了数字图像抠图技术的数学基础。对于大部分图像来说,大部分像素点都是确定的前景或背景像素点,但想要将前景物体从背景中准确的提取出来,怎样准确的估计出每个像素的alpha值是抠图问题的难点所在。而抠图问题是一个欠约束的病态问题,对于一幅给定的图像C,该图像的alpha值、前景颜色和背景颜色都是未知的,抠图问题的目标就是确定图像中每一个像素点所对应的这三个值。已知的信息只有每个像素点的三维颜色向量I,需要用三个已知量求解七个未知量。若没有额外的信息作为先验假设,其解空间是无穷多的。
对于用户提供额外的信息,目前主要的方法是用户手工标注三个区域:前景区域F、背景区域B以及未知区域U,这种将图像划分为三部分的标注图像称为Trimap。此外还有一种更为简单的scribble方式。在trimap的帮助下,抠图问题简化为根据已知的前景、背景区域信息来估计未知区域每个像素点的alpha值。图像中每个alpha值可以构成一幅图像,称有alpha值构成的图像为输入图像的matting图像。
在本发明中,我们提出了利用稀疏字典对matting图像进行优化。因其在多方面取得了优越的特性,其理论被广泛的应用于多个领域。图像的稀疏表示是指图像可以由一组原子图像的线性组合表示,所有的原子图像即构成一个稀疏字典。组合形成图像的原子之间不仅要具有完备性,还需具有一定的冗余性,形成过完备字典。基于学习的方法构造稀疏字典,通过对ground truth图像和matting图像的特征块进行学习,建立它们之间的关系,将这种关系作为先验,指导matting图像的重建。
构造字典是稀疏表示的关键问题。字典学习的过程可以分为两个过程:稀疏编码和字典更新。MOD算法交替进行稀疏编码和字典更新,只需要几次迭代就可以得到收敛的结果。但此算法需要计算逆矩阵,复杂度较高。训练联合正交基字典,此方法的模型约束较多。使用推广的PCA的方法设计过完备字典,但这类字典对于复杂的自然信息可能限制过多,且检测字典原子个数的算法复杂度较高,特别是当子空间数量和维数都特别大时。奇异值分解(SVD)和K均值聚类算法进行稀疏编码,以较快的速度构建一个误差较小的字典。字典逐个原子进行更新,同时更新相关系数以达到进一步的加速。采用奇异值分解构成原子更新(迭代K次,K为原子的数目)的核心,因此该算法被称为K-SVD算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东工商学院,未经山东工商学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910917074.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序