[发明专利]基于学习的视频中显著物体序列自动检测方法有效

专利信息
申请号: 200810150324.8 申请日: 2008-07-11
公开(公告)号: CN101329767A 公开(公告)日: 2008-12-24
发明(设计)人: 刘铁;袁泽剑;郑南宁;盛兴东;崔超;张耿;董毅 申请(专利权)人: 西安交通大学
主分类号: G06T7/20 分类号: G06T7/20;G06K9/46
代理公司: 西安通大专利代理有限责任公司 代理人: 陈翠兰
地址: 710049*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于学习的视频中显著物体序列自动检测方法,该方法首先计算静态显著性特征,计算动态显著性特征,并与静态显著性特征自适应组合起来构成显著性特征约束。计算每帧图像中的空间连续性。计算相邻帧图像中显著物体的时间连续性。这里计算所有可能的显著物体之间的相似度。利用前一次计算获得显著物体序列计算全局主题模型,并计算相应的能量贡献。利用动态规划算法进行全局最优求解,从而获得全局最优的显著物体序列。当未满足收敛条件继续迭代求解。否则,输出矩形框序列作为最优的显著物体序列。本发明能有效解决静态与动态显著性特征的选取与多种约束条件的优化集成,以及目标序列检测的高效计算。
搜索关键词: 基于 学习 视频 显著 物体 序列 自动检测 方法
【主权项】:
1、基于学习的视频中显著物体序列自动检测方法,其特征在于,包括以下步骤:1)计算静态显著性特征:局部、区域和全局显著性特征计算来自每一帧图像的静态线索;2)计算动态显著性特征,并与静态显著性特征自适应组合起来构成显著性特征约束;计算动态显著性特征方法如下:采用对每个像素点在多尺度上利用Simoncelli滤波器来计算运动场M,对运动场进行加权,加权权值计算如下:W(x,M)=exp(-εc‖V(x,M)‖2),其中εc=0.2,V(x,M)是来自像素点x周围5×5的窗口内运动场的标准方差;对于加权的运动场,扩展(Tie,IEEE CVPR’07)中的局部、区域全局性显著性特征到加权运动场中来计算运动场显著性特征:加权多尺度对比度:fMc(x,M)=Σl=1LΣxN(x)WxlWxl||Ml(x)-Ml(x)||2,加权中间-周围直方图:fMh(x,M)Σ{x|xRM*(x)}wxxWxχ2(RM*(x),RMs*(x)),加权运动场空间分布fMs(x,M)ΣmWxp(m|Mx)(1-V(m)),其中Wx为运动场的权重,M是运动场向量,N(x)代表x周围一定区域内的像素集,L是总的层数,l代表当前层数,Ml是金字塔中第l层的二维运动场,Wx l是像素点x的权重,RM *是以x′为中心且包括x的矩形框内的统计直方图,是对应的周围矩形框内的统计直方图,wxx′是空间的距离上的权重,Wx′ 表明了像素点x′的权重,χ2表示直方图间的距离,V(m)为每个高斯元的空间分布方差,m代表高斯元序号。使用同样的参数可以获得最终组合的加权运动场显著性特征:FM(x)=ΣkλkfMk(x,M)运动显著性在时间维度上的自适应平滑,采用前后两帧运动显著特征的自适应组合方式:FMt(x)=StSt+St-1FMt(x)+St-1St+St-1FMt-1(x),这里St定义为权重,计算如下:St=1-exp(-βsDFM)1+exp(-βsDFM),其中βs=0.1,定义了两个5×5的窗口区域里显著性的最大差,定义如下:DFM=maxxΣxN(x)||FMt(x)||-minxΣxN(x)||FMt(x)||,其中N(x)表明5×5的窗口邻域;将自适应平滑后的动态显著性和静态显著性自适应组合起来构成最终的显著性约束:Ft(x)=FSt+St×FMt(x),其中St为平滑的运动场显著性上重新计算的运动显著的权重,从定义中可以看到St∈[0,1];3)计算每帧图像中的空间连续性,具体方法如下:显著物体被表示为一个矩形框,空间连续性被定义为刻画矩形框边界与真实的图像边缘之间的吻合程度,即SCt(At,It)=λSΣx,xδ(axax)DEt(x,It),这里DEt(x,It)[0,1]表示像素点x到图像边缘的归一化距离,λs=0.1×W×H|Lt|,其中|Lt|为矩形框上像素点的个数,W和H为图像的宽度和高度,Sobel算子用来计算图像的边界并自适应的选择门限值进行二值化可以获得图像的边缘信息;4)计算相邻帧图像中显著物体的时间连续性,时间连续性数学定义如下:TCt(At,t+1,It,t+1)=β1S(At,At+1)+β2χ2(At,At+1),其中S(At,At+1)=Σ{axt,axt+1,}||axt-axt+1,||定义了相邻两帧图像中显著物体的形状相似度,而χ2(At,At+1)定义了相邻两帧图像中显著物体的表面模式之间的相似度,这里为颜色直方图的χ2距离,β1=0.5×W×HW+H,β2=0.01为权值以保持与其它能量项的平衡;5)利用前一次计算获得显著物体序列计算全局主题模型,并计算相应的能量贡献,从第二次迭代开始;利用前次检测结果在整个序列里比较保守的收集显著物体和背景的样本策略,然后利用这些样本构造出显著物体的颜色直方图HF(b)和背景的颜色直方图HB(b),这里b表示直方图的位阶,然后对每帧图像的每一个像素点计算一个似然,全局主题模型在能量函数中的贡献计算如下:Gt(At)=ΣxAtHB(bx)HF(bx)+HB(bx)+ΣxAtHF(bx)HF(bx)+HB(bx),其中bx为像素点x的颜色直方图值;6)利用动态规划算法进行全局最优求解,从而获得全局最优的显著物体序列;视频中显著物体序列检测的数学建模如下:视频可以表示为图像序列I1…T,其中T为总帧数,显著物体序列A1…T∈{0,1}为二值模板图序列,标明每个像素点是否为显著物体,计算给定观测数据I1…T的情况下A1…T的条件分布,即P(A1...T|I1...T)=1Zexp(-ΣtEt(At|I1...T,Att)),其中t∈[1,T]是时间刻度,Z是归一化函数,显著物体序列A1…T通过最小化能量函数进行求解:A1...T*=argminA1...TΣtEt(At|I1...T,Att)---(1)能量函数Et(At|I1…T,At′≠t)可以定义为这些线索的线性组合:Ft为显著性约束,为空间连续性,为时间连续性,Gt为全局主题模型;动态规划算法设计如下:At是状态变量(中心和尺度),Ut是相邻两帧之间矩形框变化的可能策略,那么最优值函数可以写作:St+1(At+1)=argminUtSt(At)+Et(At)---(3)其中At=T(At+1,Ut)从状态转移函数计算而来,E(At)为(2)式定义的能量函数,目标函数的初始值为S0=0,前向算法可以用来进行最优值计算,获得全局最优的矩形框序列A1…T,在第一次进行能量最小化计算的时候,用到静态和动态显著性、时间与空间连续性,即:7)当未满足收敛条件,输出序列不再变化或者达到一定的迭代次数时跳转步骤5)继续迭代求解,否则,输出矩形框序列作为最优的显著物体序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810150324.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top