[发明专利]基于学习的视频中显著物体序列自动检测方法有效
申请号: | 200810150324.8 | 申请日: | 2008-07-11 |
公开(公告)号: | CN101329767A | 公开(公告)日: | 2008-12-24 |
发明(设计)人: | 刘铁;袁泽剑;郑南宁;盛兴东;崔超;张耿;董毅 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06T7/20 | 分类号: | G06T7/20;G06K9/46 |
代理公司: | 西安通大专利代理有限责任公司 | 代理人: | 陈翠兰 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 视频 显著 物体 序列 自动检测 方法 | ||
1.基于学习的视频中显著物体序列自动检测方法,其特征在于,包括以 下步骤:
1)计算静态显著性特征:局部、区域和全局显著性特征计算来自每一帧 图像的静态线索;
2)计算动态显著性特征,并与静态显著性特征自适应组合起来构成显著 性特征约束;
计算动态显著性特征方法如下:
采用对每个像素点在多尺度上利用Simoncelli滤波器来计算运动场M, 对运动场进行加权,加权权值W的计算如下:W(x,M)=exp(-εc||V(x,M)||2), 其中x为象素点坐标,M为运动场向量,εc=0.2为参数,V(x,M)是来自像素点 x周围5×5的窗口内运动场的标准方差;
对于加权的运动场,扩展局部、区域和全局性显著性特征到加权运动场 中来计算运动场显著性特征:
定义在运动场的局部显著性特征为加权多尺度对比度其计算 公式为:
定义在运动场上的区域显著性特征为加权中间-周围直方图其计算公式为:
定义在运动场上的全局显著性特征为加权运动场空间分布其 计算公式为
其中x为象素点坐标,Wx为运动场的权重,M是运动场向量,N(x)代表 x周围一定区域内的像素集,L是总的层数,l代表当前层数,Ml是金字塔中 第l层的二维运动场,Wxl是像素点x的权重,RM*是以x′为中心且包括x的矩 形框内的统计直方图,是对应的周围矩形框内的统计直方图,Wxx′是空间 的距离上的权重,Wx′表明了像素点x′的权重,χ2表示直方图间的距离,V(m) 为每个高斯元的空间分布方差,m代表高斯元序号,通过对训练数据的学习 获得最终组合的加权运动场显著性特征:
其中,为上述介绍的定义在运动场上的局部、区域和全局显著性特征,λk为对应局部、区域和全局显著性特征的参数。上述定义默认为在第t帧图像 中的定义。
运动显著性在时间维度上的自适应平滑,采用前后两帧运动显著特征的 自适应组合方式,即自适应组合后第t帧图像中的显著性特征FMt(x)由第t 帧图像中的显著性特征FMt(x)和第t-1帧图像中的显著性特征FMt-1(x)计算:
这里St和St-1定义为权重,计算如下:其中βs=0.1, 被定义为两个5×5的窗口区域里显著性的最大差,定义如下: 其中N(x)表明5×5的窗口邻 域;
将自适应平滑后的动态显著性和静态显著性自适应组合起来构成最终 的显著性约束:Ft(x)=FSt(x)+St×FMt(x),其中St为平滑的运动场显著性上重新 计算的运动显著的权重,从定义中看到St∈[0,1];
3)计算每帧图像中的空间连续性,具体方法如下:
显著物体被表示为一个矩形框,空间连续性被定义为刻画矩形框边界与 真实的图像边缘之间的吻合程度,即空间连续性特征由当前图像It和当前帧 的标记结果At计算而来,其计算公式为其 中,ax表示象素点x处的标记值,ax=1表明象素点x属于显著性物体,ax=0 表明象素点x不属于显著性物体。表示像素点x到图像边缘的归 一化距离,其中|Lt|为矩形框上像素点的个数,W和H为图 像的宽度和高度,Sobel算子用来计算图像的边界并自适应的选择门限值进 行二值化并获得图像的边缘信息;
4)计算相邻帧图像中显著物体的时间连续性,时间连续性数学定义如下: 其中定义 了相邻两帧图像中显著物体的形状相似度,而χ2(At,At+1)定义了相邻两帧图像 中显著物体的表面模式之间的相似度,这里为颜色直方图的χ2距离, β2=0.01为权值以保持与其它能量项的平衡;
5)如果是第一次迭代,跳转到步骤6)继续,否则对于第n次迭代,利 用第n-1次迭代计算获得的显著物体序列计算全局主题模型,并计算相应的 能量贡献;
利用第n-1次迭代计算获得的显著物体序列结果在整个序列里比较保守 的收集显著物体和背景的样本策略,然后利用这些样本构造出显著物体的颜 色直方图HF(b)和背景的颜色直方图HB(b),这里b表示直方图的位阶,然后 对每帧图像的每一个像素点计算一个似然,全局主题模型在能量函数中的贡 献计算如下:其中bx为像 素点x的颜色直方图值;
6)利用动态规划算法进行全局最优求解,从而获得全局最优的显著物体 序列;
视频中显著物体序列检测的数学建模如下:将视频表示为图像序列I1…T, 其中T为总帧数,显著物体序列A1…T∈{0,1}为二值模板图序列,标明每个像素 点是否为显著物体,计算给定观测数据I1…T的情况下A1…T的条件分布,即 其中t∈[1,T]是时间刻度,Z是归一化函 数,显著物体序列A1…T通过最小化能量函数进行求解:
能量函数Et(At|I1…T,At′≠t)被定义为这些线索的线性组合:
Ft为显著性约束,为空间连续性,为时间连续性,Gt为全局主题模 型;
动态规划算法设计如下:At是状态变量,该状态变量由第t帧中矩形框 的中心位置和尺度大小构成,Ut是相邻两帧之间矩形框变化的可能策略,那 么最优值函数定义为:
其中At=T(At+1,Ut)从状态转移函数计算而来,E(At)为(2)式定义的能量 函数,目标函数的初始值为S0=0,前向算法被用来进行最优值计算,获得全 局最优的矩形框序列A1…T,在第一次进行能量最小化计算的时候,用到静态 和动态显著性、时间与空间连续性,即:
7)当未满足收敛条件,输出序列不再变化或者达到一定的迭代次数时跳 转步骤5)继续迭代求解,否则,输出矩形框序列作为最优的显著物体序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810150324.8/1.html,转载请声明来源钻瓜专利网。