[发明专利]可变视角及分辨率的双目视觉系统目标图像稳定化方法有效
申请号: | 200910088991.2 | 申请日: | 2009-07-17 |
公开(公告)号: | CN101616310A | 公开(公告)日: | 2009-12-30 |
发明(设计)人: | 周杰;万定锐;胡瀚 | 申请(专利权)人: | 清华大学 |
主分类号: | H04N7/18 | 分类号: | H04N7/18;G06T7/20 |
代理公司: | 北京众合诚成知识产权代理有限公司 | 代理人: | 朱 琨 |
地址: | 100084北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于双目PTZ视觉系统的高分辨率视频稳定化方法属于视觉监控领域,其特征在于:它同时利用由两路不同分辨率的视频,其中一路为低分辨率视角固定的全景图像,另一路为高分辨率变化视角的局部图像,包含感兴趣的运动目标。本发明建议采用两个PTZ摄像机以方便应用。高分辨率视频可以通过人工手动或者计算机自动控制摄像机运动得到。目标是得到一个完整、平稳的包含感兴趣运动目标的视频,并且尽可能采用高分辨率信息。本发明首先解决了不同分辨率视频之间的图像配准问题,其次提出四种顺序填充方式,充分利用了当前高分辨率信息以及历史高分辨率信息来填充目标视频。通过这样处理后的结果可以用于犯罪取证、监控记录保存、运动目标的行为分析等,实验结果表明本发明提出的方法很实用。 | ||
搜索关键词: | 可变 视角 分辨率 双目 视觉 系统 目标 图像 稳定 方法 | ||
【主权项】:
1.可变视角及分辨率的双目视觉系统目标图像稳定化方法,其特征在于,所述方法在PC机中依次按以下步骤实现:步骤(1),使第一个可变视角,或分辨率的PTZ摄像机作为静止摄像机,用于监控全景,再使第二个可变视角,或分辨率的PTZ摄像机抓拍感兴趣的运动目标;步骤(2),所述PC机从所述第一个PTZ摄像机中输入记录全景的图像,称为低分辨率图像ILt,并把每帧图像转换为灰度图像;所述PC机从所述第二个PTZ摄像机中输入记录运动目标的图像,称为高分辨率图像IHt,把每帧图像转换为灰度图像,并用所述的两个灰度图分别代替所述的ILt和IHt;步骤(3),不同分辨率视频图像之间的配准:选择第t帧低分辨率图像ILt中所述运动目标所在的矩形区域ILt_tar所对应的高分辨率图像作为系统的输出图像Ioutt,然后计算所述高分辨率图像IHt和所述低分辨率图像ILt之间的映射模型MLHt,具体如下:步骤(3.1),所述矩形区域ILt_tar的选定,步骤(3.1.1),对所述低分辨率图像ILt求取低分辨率背景模型ILBt,像素(x,y)处的更新公式为:I LB t ( x , y ) = ( 1 - α ) I LB t - 1 ( x , y ) + α I L t ( x , y ) , ]]> 其中更新系数α=0.05,初始低分辨率背景模型I LB t = 0 ( x , y ) = I L t = 0 ( x , y ) , ]]> 如果| I L t ( x , y ) - I LB t ( x , y ) | > T LB , ]]> TLB=20,则ILt在(x,y)属于前景区域,否则,该像素属于背景区域,步骤(3.1.2),利用Opencv提供的Mean-shift跟踪算法,通过给定原始灰度图像ILt以及步骤(3.1.1)得到的前景区域,即可求得感兴趣目标在ILt图像中的位置,并在设定帧数的帧邻域内对所跟踪的目标中心进行均值平滑,平滑后的中心即为所述目标的中心,也是所述矩形区域的中心,该矩形区域的长宽设为64×48像素,最终得到的高分辨率输出图像Ioutt的尺寸为所述矩形区域的ILt_tar的ko倍,ko=5,步骤(3.2),用基于特征点的配准方法求取所述低分辨率图像ILt和高分辨率图像IHt之间的初步映射模型MLH1t:步骤(3.2.1),计算所述第t帧高分辨图像IHt和低分辨率图像ILt中目标区域ILt_tar的SIFT特征点,步骤(3.2.2),对IHt中的每个特征点,分别计算它和所述低分辨率图像目标区域ILt_tar中的每个特征点之间的距离,即s12=||v1-v2||,其中v1和v2分别表示两个特征点对应的SIFT特征向量,然后考虑距离最小的两组结果smin1和smin2,如果
Ts=0.7,则smin1对应的特征点为匹配点,否则认为该点没有匹配特征点,如果两图之间的总匹配特征点对的个数少于10,则认为所述映射模型MLHt无效,转到步骤(4),否则转到步骤(3.3),步骤(3.2.3),对所述的高分辨率图像IHt与所述低分辨率图像目标区域ILt_tar的SIFT匹配特征点对{ ( x i 1 , y i 1 ) ∈ I L t , ( x i 2 , y i 2 ) ∈ I H t } , i = 1,2 , . . . , n , ]]> 求取仿射变换矩阵M LH 1 t = m 1 m 2 m 3 m 4 m 5 m 6 0 0 1 , ]]> 其中参数通过下式求取:[m1,m2,m3,m4,m5,m6]T=(ATA)-1AX,其中,A = x 1 1 y 1 1 1 0 0 0 0 0 0 x 1 1 y 1 1 1 x 2 1 y 2 1 1 0 0 0 0 0 0 x 2 1 y 2 1 1 . . . . . . . . . . . . . . . . . . x n 1 x n 1 1 0 0 0 0 0 0 x 1 1 x 1 1 1 , ]]>X = x 1 2 y 1 2 x 2 2 y 2 2 . . . x n 2 y n 2 , ]]> 步骤(3.3),调整所述低分辨率图像ILt的灰度值,得到校正图像ILt_adj步骤(3.3.1),选定计算灰度映射的区域:对步骤(3.2)中所述两幅图像IHt和ILt_tar中匹配上的特征点集分别用一个凸多边形表示,该凸多边形以特征点为顶点,所有特征点都在多边形内部或顶点处,该凸多边形内部即为灰度映射区域,步骤(3.3.2),统计上述凸多边形内的灰度直方图hist(k),k=0,1,…,255,按下式得到累计直方图:Accu ( K ) = Σ k = 1 K hist ( k ) Σ k = 1 32 hist ( k ) , K = 0,1 , . . . , 255 ]]> 步骤(3.3.3),用Accu1和Accu2分别表示ILt和IHt的累积分布直方图,按下述方法划分三个灰度集合G1,G2,G3:G1={K:0≤A≤Accu1(K)<0.05}G2={K:0.05≤Accu1(K)<0.95}G3={K:0.95≤Accu1(K)≤1}选取映射模型为三段分片线性模型K 2 = MI ( K 1 ) = a 1 K 1 + b 1 , K 1 ∈ G 1 a 2 K 1 + b 2 , K 1 ∈ G 2 a 3 K 1 + b 3 , K 1 ∈ G 3 , ]]> 其中K1和K2分别表示ILt和IHt的灰度值,利用下面的目标函数线性拟合K∈G2时所述图像ILt和IHt之间的灰度值映射函数K2=MI(K1)=a2K1+b2,K1∈G2:
用灰度集合G1、G3分别拟合模型K2=MI(K1)=a1K1+b1,K1∈G1和K2=MI(K1)=a3K1+b3,K1∈G3,使得MI(0)=0,MI(255)=255,步骤(3.3.4),根据ILt和IHt之间的灰度值映射模型MI(k)调整ILt的灰度值,得到ILt_adj,步骤(3.4)基于像素的直接配准方法估计ILt和IHt之间更精确的仿射模型MLH2t:步骤(3.4.1),用步骤(3.2)中所述的MLH1t对所述的高分辨率图像IHt进行变换,得到图像IHt_adj,变换方法是:所述图像IHt_adj在坐标点(xi,yi)的值I H _ adj t ( x i , y i ) = I H t ( f ( x i , y i , ( M LH 1 t ) - 1 ) ) , ]]> 其中f是同构坐标变换函数,计算方法是:f(x,y,M)=(x′,y′),其中x和y′由[x′,y′,1]T=M[x,y,1]T得到,步骤(3.4.2),用迭代的梯度下降的方法求解下面的优化问题,得到模型Mrefinedt:M refined t = arg min M Σ i | | I H _ adj t ( x i , y i ) - I L _ adj t ( f ( x i , y i , M ) ) | | ]]> 其中(xi,yi)是所述图像IHt_adj的第i个像素点坐标,f见步骤(3.4.1),迭代初始值M0设为3×3的单位矩阵,步骤(3.4.3),如果步骤(3.4.2)中所求得的Mrefinedt满足下面两个条件中的任何一个,则认为Mrefinedt和MLH2t无效,不再对其进行计算,转到步骤(4),a)| | R 2 × 2 M - I 2 × 2 | | ∞ < 0.3 ; ]]> b)| | t 2 × 1 M | | ∞ < 4 ; ]]> 其中,M refined t = R M t M , ]]> [R2×2M t2×1M]是Mrefinedt的前两行,步骤(3.4.4),计算更精确的仿射模型M LH 2 t = M LH 1 t M refined t , ]]> 步骤(3.5)根据邻域2N+1帧图像对所述输出图像Ioutt进行平滑处理,取N=5,步骤(3.5.1),求取第j帧高分辨率图像到第i帧高分辨率图像的变换模型Mji由步骤(3.1.1)中所求得的ILt中的前景区域通过步骤(3.4.1)中的变换方法由所述的更精确的仿射模型MLH2t得到对应的IHt中的前景目标,进而得到IHt的背景区域,用步骤(3.2)中的方法,求取所述第j帧高分辨图像IHj和第i帧高分辨率图像IHi之间的变换模型Mji,步骤(3.5.2)求取平滑模型MLHt,M LH t = Σ i = t - N t + N ω i δ i M i t M LH 2 i Σ i = t - N t + N ω i δ i ]]> 其中,ωi是高斯权重系数,N=5,ω i = 1 2 π σ e ( i - t ) 2 2 σ 2 , ]]> σ=1.5,δi取值为:
步骤(3.5.3)计算当前帧的相对模糊度btb t = 1 Σ p t [ dx 2 ( p t ) + dy 2 ( p t ) ] ]]> 其中,pt为所述第t帧高分辨率图像IHt中的像素点,dx(·)和dy(·)分别是图像沿着x和y方向上的梯度,如果bt>1.3min{bt-1,bt+1},则认为当前帧为模糊图像,并设定MLHt无效;步骤(4)图像补全:对所述输出图像中未被高分辨率图像完全覆盖的部分进行图像补全,具体步骤如下:步骤(4.1)估计高分辨率背景图像IHBt步骤(4.1.1)如果步骤(3)中所述的MLHt有效,通过步骤(3.4.1)中所述的变换方法由所述的变换模型MLHt变换得到与步骤(3.1.1)所述低分辨率图像ILt中的背景区域ILBt对应的IHt中的背景区域,步骤(4.1.2)对第t帧,用第1,2,…,t+50帧中的高分辨率背景区域来更新当前高分辨率背景模型IHBt,对于下一帧的背景模型IHBt+1,如果MLHt有效,则将IHt+51的背景区域映射到IHBt上,然后对于重叠区域用0.5的衰减因子进行更新,即对背景区域的像素灰度值进行如下处理:I HB t + 1 = 0.5 I HB t + 0.5 I H t + 51 ; ]]> 否则,I HB t + 1 = I HB t , ]]> 步骤(4.2)对Ioutt进行填充:步骤(4.2.1)利用所述的高分辨率图像IHt和变换模型MLHt填充图像,如果MLHt有效,则用步骤(3.4.1)中所述的变换方法由所述的变换模型MLHt将所述高分辨率图像IHt变换到所述输出图像Ioutt上,所述输出图像Ioutt中重叠的区域即可用IHt的灰度值进行填充,步骤(4.2.2)对背景部分,如果所述输出图像Ioutt的未填充部分包含背景像素,则直接利用IHBt中对应的有效像素进行填充,步骤(4.2.3)对前景部分,如果第t帧满足下面三个条件之一时,转到步骤(4.2.3.1),否则转到到步骤(4.2.4)a)所述的变换模型MLHt无效b)所述的高分辨率图像IHt不包含完整的感兴趣目标c)步骤(3.5.3)中判断所述的高分辨率图像IHt是模糊的图像步骤(4.2.3.1)建立和更新参考样本队列参考样本队列最大长度取为60,如果第t帧同时满足下面三个条件之一,则该帧将产生一个参考样本:a)所述的变换模型MLHt有效;b)所述的高分辨率图像IHt包含完整的感兴趣目标;c)所述的高分辨率图像IHt不是模糊的图像;参考样本由两个包含前景区域的图像块构成,分别由只保留前景区域的ILt和IHt,用SP t = { SP L t , SP H t } ]]> 表示,其中SPLi表示第i帧只包含前景目标的低分辨率图像固定大小参考帧,大小为40×40,SPHi表示第i帧只包含前景目标的与SPLi相对应的高分辨率图像的参考帧,大小为200×200,采用先入先出的策略更新参考帧队列,步骤(4.2.3.2)在所述参考帧队列中查找与当前帧最匹配的参考帧
对于第t帧,我们只考虑ILt中完全包含目标的矩形图像区域sub(ILt),用下面的步骤计算参考帧队列中所有的SPLi,i=1,2,...,60与sub(ILt)的相似度:步骤(4.2.3.2.1)计算SPLi到sub(ILt)的平移变换模型(dx,dy)T选取初始值为sub(ILt)中前景目标中心点坐标与SPLi中前景目标中心点的差,用基于迭代的梯度下降优化算法求得平移变换模型(dx,dy)T,步骤(4.2.3.2.2)用下面的公式计算相似度:exp ( - 1 Num ( p ) Σ p ∈ Foreg ( I L t ) , p - ( dx , dy ) T ∈ Foreg ( SP L i ) | ( sub ( I L t ) ) ( p ) - SP L i ( p - ( dx , dy ) T ) | ) ]]> 其中,Foreg(SPLi)是SPLi的前景目标的像素集合,Foreg(ILt)是ILt前景目标的像素集合,p是SPLi经过平移变换后其前景目标像素集合与Foreg(ILt)的交集中的一个像素,Num(p)是交集中像素的个数,如果交集的像素个数小于Foreg(SPLi)像素个数的60%,或者小于Foreg(ILt)像素个数的60%,则令相似度为0,如果当前帧t有效,则取本帧为相关参考帧,定义为
即reft=t;否则,则取队列中与sub(ILt)相似度最大的参考帧为相关参考帧,若最大相似度小于ThMAD=exp(-20),则认为sub(ILt)没有相关参考帧,即
无效,转到策略(3);否则
有效,步骤(4.2.3.2.3)估计当前帧与其参考帧之间的高分辨率图像光流场VH,由邻近共三帧及其对应的参考帧
i=t-1,t,t+1进行估计:步骤(4.2.3.2.3.1)采用基于迭代的梯度下降优化算法求得从
到
的平移变换模型,然后用此模型将
变换到SPt-1t,从而去除了两者之间的整体运动;同理,对
进行同样操作,得到去除整体运动的SPt+1t;对当前帧,即第t帧,令SP t t = SP H ref t ]]> 步骤(4.2.3.2.3.2)利用调整后的SPt-1t,SPtt,SPt+1t来估计高分辨率的光流场VH用Opencv提供的Lucas-Kanade光流算法分别估计从SPtt到SPt-1t和SPt+1t之间的光流场Vt,t-1H和Vt,t+1H,则V H = 1 2 ( V t , t - 1 H + V t , t + 1 H ) ]]> 步骤(4.2.3.2.4)估计帧内低分辨率图像光流场VL,同样采用Opencv提供的Lucas-Kanade光流算法估计
与sub(ILt)之间的光流场FLt,将其放大5倍即可得到VL,步骤(4.2.3.2.5)如果
有效,估计
与Ioutt之间的最终光流场FHt,FHt由下面的优化问题解得:min E = β Σ ( x , y ) ∈ V ω 1 ( x , y ) [ ( u - u H ) 2 + ( v - v H ) 2 ] ]]>+ γ Σ ( x , y ) ∈ V ω 2 ( x , y ) [ ( u - u L ) 2 + ( v - v L ) 2 ] ]]> 其中V是图像有效区域,(x,y)是V中的一个像素,u和v分别是u(x,y)和v(x,y)的简写,分别代表FHt在(x,y)点沿x方向和y方向的分量,(uH,vH)代表VH在(x,y)处的取值,ω1(x,y)是权重系数,取为ω1(x,y)=exp(-||[uH,vH]||/10),(uL,vL)代表VL在(x,y)处的取值,ω2(x,y)是权重系数,取为ω2(x,y)=1,如果VH有效,则取β=2,γ=1,否则,取β=0,γ=1,步骤(4.2.3.2.6)填充输出图像,用
经过光流场FHt的变换后采用双线性插值填充输出图像的前景部分,步骤(4.2.4)对还未填充的区域,用低分辨率的图像ILt放大并用双线性插值得到,步骤(4.3)灰度值调整用步骤(3.3)中所述的方法调整输出图像中区域R1和R4,与R2灰度值保持一致,其中R1是所述输出图像Ioutt中用步骤(4.2.1)填充的图像区域,R2是所述输出图像Ioutt中用步骤(4.2.2)填充的图像区域,R3是所述输出图像Ioutt中用步骤(4.2.3)填充的图像区域,R4是所述输出图像Ioutt中用步骤(4.2.4)填充的图像区域,调整R1时,只用R1与所述高分辨率背景模型IHBt重叠部分的像素计算灰度值映射模型,并只调整这些重叠部分的像素,调整R4时,亦只用R4与所述高分辨率背景模型IHBt重叠部分的像素计算灰度值映射模型,但对所有的像素值均进行调整,步骤(4.4)输出图像空间连续性调整对于步骤(4.3)中所述的输出图像区域R1,R2和R4作如下处理:先对边界部分用5×5的结构单元进行形态学膨胀,再对膨胀后的边界部分用3×3的均值滤波器进行平滑,步骤(4.3)中所述的输出图像区域R3部分保持不变。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910088991.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种抗菌抗紫外线棉织物及其制备工艺
- 下一篇:一种高频热压PVC涂层布工艺