[发明专利]一种蓝屏抠图方法有效
申请号: | 201410436813.5 | 申请日: | 2014-08-29 |
公开(公告)号: | CN104200470B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 胡绍湘;詹肇楷;陈奋 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00 |
代理公司: | 成都行之专利代理事务所(普通合伙)51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蓝屏 方法 | ||
技术领域
本发明属于视觉特效领域,更为具体地讲,涉及一种蓝屏抠图方法。
背景技术
抠图是指从图像或视频序列中精确地提取出前景对象的一种技术。抠图技术作为视觉特效领域的一种关键技术,被广泛地应用于图像编辑和电影制作等领域。但由于抠图问题的欠约束性,求解该问题时需要增加额外的约束条件,因此在影视制作中,通常采用蓝屏或者绿屏作为拍摄背景,以此来降低该问题的求解难度,这种将蓝屏或者绿屏作为背景的抠图技术通常叫做蓝屏抠图技术。
蓝屏抠图发展到今天已经产生了许多不同的技术。常见的蓝屏抠图技术主要有:亮度抠图(Luma Keying)、差异抠图(Difference Keying)、色度抠图(Chroma Keying)、色差抠图(Color Difference Keying)、3D抠图(3D Keying)。
亮度抠图技术利用图像的亮度信息来求解不透明度。对于给定的RGB三通道彩色图像,先将其转换到HLS颜色空间,然后取亮度通道L进行二值化操作,得到的结果即为前景的不透明度。简单的硬阈值操作通常会造成边缘和半透明信息的严重丢失,因此,在实际应用中通常采取软阈值操作,即定义一个渐变的范围,使得不透明度从0到1平缓变化。由于该技术在抠图过程中只考虑了图像的亮度信息,而没有考虑图像的颜色信息,因此,对于大多数图像,该方法效果不够理想。
差异抠图技术利用前景图像与背景图像的差异求解不透明度。差异抠图技术对背景没有严格的限制,不仅适用于单色背景,对于背景颜色复杂的情况同样适用。然而,由于差异抠图技术需要背景图像已知,因此其使用范围受到了一定的限制。
色度抠图技术利用图像的颜色信息求解不透明度。对于给定的RGB三通道彩色图像,首先将其转换到HLS空间,然后对H通道进行阈值分割求取不透明度。在实际应用中,受光照等环境因素的影响,背景颜色会出现一定的波动,因此需要设置一个软阈值。然而,H通道虽然能较好地区分颜色信息,但是对于压缩的视频帧,H通道常常出现块状效应(blocky)。为了提高抠图精度,通常将色度(H)、亮度(L)、饱和度(S)三个通道结合起来。与单一通道的抠图技术相比,联合H、L、S三通道的抠图技术要更准确,不足之处是需要调节的参数较多,人工交互比较大。
色差抠图技术利用R、G、B三通道的颜色差异来求解不透明度。以蓝屏视频为例,对于输入视频帧I,其不透明度表示为α=IB-MAX(IR,IG)。色差抠图技术比较简单,速度较快且不需要进行阈值判断,然而,效果不够理想。
3D抠图技术是指在三维颜色空间(RGB、HLS等),根据像素的空间距离求解不透明度。由于背景的颜色变化范围较小,因此可以在三维空间中定义一个3D形状将前景和背景区分开来。该3D形状可以是球体,立方体,椭球体等。以简单的球体为例,为了获得渐变的不透明度,需要定义一大一小两个球体,小球体里面的像素为背景,大球体以外的像素为前景,介于两者之间的像素属于过度区域,不透明度在0到1之间变化。3D抠图技术虽然能取得较好的效果,但是速度和人工交互仍然有待进一步提高。
从以上分析可以看出,现有的蓝屏抠图技术在抠图速度,抠图质量和人工交互上不能同时取得理想的效果,因此,对蓝屏抠图技术进行深入研究是很有必要的。
发明内容
本发明的目的在于克服现有技术的不足,提供一种蓝屏抠图方法,通过在GPU中对视频帧进行蓝屏抠图处理,具有抠图速度快,抠图效果好,且不需要调整太多的参数和人工交互等优点。
为实现上述发明目的,本发明一种蓝屏抠图方法,其特征在于,包括以下步骤:
(1)、传递视频到GPU
对GPU进行初始化;在CPU端通过视频输入、输出接口向GPU端申请纹理内存、常量内存和全局内存;
CPU端申请内存成功后,再次通过视频输入、输出接口将视频帧传递到纹理内存,将视频的参数向量传递到常量内存,同时将选取的一幅背景合成图像传递到全局内存;
(2)、GPU的并行计算线程块对视频进行处理
从纹理内存中读取视频帧,从常量内存中读取视频的参数向量到GPU的并行计算线程块,在GPU的并行计算线程块中分别对所有视频帧进行处理;
(2.1)、提取背景色
将视频的第一帧图像作为蓝屏图像,再读取视频的参数向量得到蓝屏图像的结构信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410436813.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于虚拟球形光源的多光源渲染方法
- 下一篇:心脏三维图像的分割方法和装置