[发明专利]适于低景深图像的语义对象分割方法无效

专利信息
申请号: 200810040000.9 申请日: 2008-07-01
公开(公告)号: CN101299268A 公开(公告)日: 2008-11-05
发明(设计)人: 李伟伟;刘志;顾建栋;韩忠民;颜红波 申请(专利权)人: 上海大学
主分类号: G06T7/00 分类号: G06T7/00;G06T5/00;G06K9/46
代理公司: 上海上大专利事务所 代理人: 何文欣
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 适于 景深 图像 语义 对象 分割 方法
【权利要求书】:

1.一种适用于低景深图像的语义对象分割方法,其特征在于引入梯度直方图计算出图像在能量空间中的分布,结合低景深图像的性质得到能量聚焦显著图,然后利用双边滤波器和形态学工具对能量聚焦显著图进行再处理,接下来设定阈值处理得到初始对象掩模图,为了提高分割精度,结合canny算子检测得到的边缘信息得到修正后对象掩模;最后使用贝叶斯羽化算法得到理想的语义对象分割结果;本方法可以有效地在图像视频序列中对低景深范围内的语义对象实现精确分割;其具体步骤是:

a.梯度能量处理:首先给出能量函数公式,即下列公式(1):对图像分别进行x,y两个方向的偏导数,取它们的绝对值作为能量函数的分子项;求得每一个像素点的方向梯度直方图HoG最大值,通过计算像素点i(x,y)的11×11邻域中所有像素点的方向梯度角,划分到20个区间中,寻找出HoG最大值数目作为该像素点分母项;其中i(x,y)为图像像素值,

EHoG=|xi|+|yi|max(HoG(i(x,y)))---(1)]]>

①将一幅图像区分为聚焦区域和散焦区域;定义rfo(x,y)和runfo(x,y)分别为低景深图像中的聚焦和散焦区域,原始图像i(x,y)表示为:

i(x,y)=rfo(x,y)+runfo(x,y)    (2)

②设α(x,y)为模糊函数,在数学上表示为低通滤波器,

iα(x,y)=i(x,y)*α(x,y)=rfo(x,y)*α(x,y)+runfo(x,y)*α(x,y)   (3)

式(3)表示对i(x,y)模糊处理,得到模糊图像,通过与α(x,y)卷积实行低通滤波,假设聚焦区域的高频值集中在fhigh1~fhigh2中,散焦区域中主要集中了大量的低频信息,设集中在flow1~flow2中,其中的低通滤波器α(x,y)的频率值为fα,调整fα的值使fhigh1~fhigh2频段的大量信息被滤除;模糊图像在频谱中反映为

Iα(u,v)=I(u,v)×α(u,v)=Rfo(u,v)×α(u,v)+Runfo(u,v)×α(u,v)    (4)

(4)式经过滤波处理后简化为

Iα(u,v)=I(u,v)×α(u,v)≈Runfo(u,v)×α(u,v)=Runfo(u,v)    (5)

由公式(5)可得到,对一幅低景深图像滤波后,利用原始图像与滤波后图像相减,得到原始图像中高频信息的分布;结合公式(6)得出能量聚焦显著性图EFSM,其中Ei(x,y)、E(x,y)分别表示原始图像和模糊图像分别映射到能量空间后的能量函数;通过引入梯度直方图计算出来的能量函数能够保留图像中的边缘、纹理信息,所以在能量空间中计算高频信息分布则更为精确,

EFSM(x,y)=|Ei(x,y)-E(x,y)|    (6)

b双边滤波和形态学处理:

(1)使用双边滤波器对EFSM平滑处理,双边滤波是分别对输入像素点与邻域亮度相似度和空间相似度的加权,即下列公式(7)所示:

BFSM(x,y)=1K(Σ(j,k)(x,y)exp((j-x)2+(k-y)22σb2)·exp((EFSM(j,k)-EFSM(x,y))22σi2)·EFSM(j,k)),]]>其中

K为归一化算子,η(x,y)表示以(x,y)为中心的平滑窗口;

K=Σ(j,k)η(x,y)exp(-(j-x)2+(k-y)22σb2)·exp(-(EFSM(j,k)-EFSM(x,y))22σi2))---(7)]]>

(2)对BFSM进行形态学闭处理得到MFSM;

(3)设定阈值:分别求取MFSM的均值mean和方差std,并将两者相加得到阈值为thre;

(4)阈值判断,得到初始对象掩模OOM;

c边缘处理:

(1)利用canny算子对原始图像滤波处理,得到图像的边缘信息;

(2)边缘信息结合初始对象掩模得到掩模内的边缘,对其邻域搜索扩展,使其恢复原始边缘长度,保持连通;

(3)对边缘组成的封闭区域实行“空洞”填充,得到了一个由边缘信息组成的二值边缘对象掩模EOM;

(4)对OOM和EOM叠加得到的二值索引图形态学开运算,用以平滑轮廓,去掉细小噪声点;得到修正后对象掩模AOM;

d羽化算法:

(1)由AOM图得到三值图:对AOM图由边界腐蚀一定宽度作为聚焦点区域TRIF;对AOM图由边界膨胀一定像素宽度求反得到散焦区域TRID,不确定区域TRIU为下列公式(8);这里的腐蚀和膨胀宽度是由AOM图占整幅图像的比例大小决定的,是腐蚀边界面积达到AOM图总面积的6%,膨胀边界面积达到AOM图总面积的10%;由于AOM图已基本定位了语义对象的在图像中的位置,使用羽化算法只是为了对对象边界进行细处理,TRIU=~(TRIF∪TRID)    (8);

(2)对不确定区域TRIU进行贝叶斯羽化算法处理:对不确定区域内像素判断归属于前景还是背景的问题;羽化算法基于公式C=αF+(1-α)B,

其中C为未知点的颜色,α是透明度,B是背景色,F是前景色,定义一个贝叶斯框架来公式化上式中的参数,并求解一个最大后验概率问题,即下列公式(9),其中F、B、α分别是需要求解的背景色、前景色、和不透明度,C是已经知道的图像上一点的颜色,在C已知前提下,求使得概率P最大的F、B、α,就是需要做的事情,L是对数函数,将乘法化为加法,简化计算,

arg maxP(F,B,α|C)

=arg maxF,B,αP(C|F,B,α)P(B)P(α)/P(C)    (9)

=arg maxF,B,αL(C|F,B,α)+L(F)+L(B)+L(α)

对等式右边分别建模,求解过程是一个迭代过程,在假设α已知的条件下对建模后的右式求偏导数转化为简单的线形方程组问题,求取出F,B,

ΣF-1+2/σC2(1-α)/σC2(1-α)/σC2ΣB-1+(1-α)/σC2FB=ΣF-1F+/σC2ΣB-1B+C(1-α)/σC2---(10)]]>

由(10)式得到F,B的值,此时对α求偏导数得到式(11)

α=(C-B)·(F-B)||F-B||2---(11)]]>

初始的α取附近像素的平均值,根据以上迭代运算所的多组解求得公式(9)最大的值;最终则得到透明度α。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810040000.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top