[发明专利]基于样本学习和深度图像传播的2D视频立体化方法有效
申请号: | 201410010043.8 | 申请日: | 2014-01-09 |
公开(公告)号: | CN103716615A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 郑喆坤;焦李成;王磊;马晶晶;马文萍;侯彪 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | H04N13/00 | 分类号: | H04N13/00;H04N13/02 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 学习 深度 图像 传播 视频 立体化 方法 | ||
1.一种基于样本学习和深度图像传播的2D视频立体化方法,其特征在于,包括如下步骤:
(1)提取图像特征:
1a)输入一帧大小为320×240的2D视频图像I1,并提取其方向梯度直方图特征向量
1b)从彩色-深度图像对RGB-D数据库中提取出大小为320×240的所有彩色图像1≤i≤N,N为数据库中彩色图像的数量,并提取这些彩色图像的方向梯度直方图特征向量
(2)从RGB-D数据库中检索相似的参考图像:
2a)分别计算输入的视频图像I1与RGB-D数据库中各个彩色图像的特征向量的欧式距离:其中,1≤i≤N;
2b)将得到的所有距离Si按从小到大的顺序排列,取前28个值所对应的彩色图像作为参考图像Jk,其中,1≤k≤28;
(3)利用中值滤波方法,从得到的28幅参考图像Jk对应的深度图像Dk中,确定输入的视频图像I1中各个像素位置的最佳深度值:d1(x)=median{Dk(x)},1≤k≤28,其中d1(x)表示输入的视频图像I1在像素位置x处的最佳深度值,median表示中值滤波运算;
(4)对输入的视频图像I1中各个像素位置的最佳深度值d1(x)进行后处理:
4a)对输入的视频图像I1与其下一帧视频图像I2,利用稠密光流估计方法计算出视频图像I1在像素位置x的运动矢量V(x)=(ux,vx),并计算像素位置x的运动强度m(x),其中,ux表示像素位置x处的水平方向的运动分量,vx表示像素位置x处的垂直方向的运动分量;
4b)设置运动强度阈值T1=20,根据像素位置x的最佳深度值d1(x)和运动强度m(x)计算该像素位置的基于运动改进的深度值d2(x):
若m(x)大于阈值T1,则d2(x)=w1×d1(x)+w2×m(x),其中,权重w1=0.6,w2=0.4,
若该处的运动强度m(x)小于阈值T1,则d2(x)=d1(x);
4c)将输入的视频图像I1分为大小为4×4的块,以各个块作为结点U,相临两个块的灰度值的差的绝对值作为这两个块的边E,构建一个有权无向图G(U,E),将G(U,E)利用克鲁斯卡尔方法构建最小生成树,将最小生成树中大于2.5的边E断开,得到的各个连通的子树即为各个分割区域Rb,1≤b≤B,B为得到的分割区域的数量;
4d)计算像素位置x的基于分割改进的深度值d3(x):
其中,Sb表示分割区域Rb内的所有像素位置的深度值之和表示分割区域Rb内的像素个数;
4e)根据输入的视频图像I1和像素位置x的深度值d3(x),利用联合双边滤波方法,计算像素位置x的基于滤波改进的深度值d4(x);
(5)根据步骤4a)中得到的运动矢量V(x)和步骤4e)得到的像素位置x的深度值d4(x),得到下一帧视频图像I2在像素位置x的深度值:d5(x)=d4(x-V(x));
(6)利用深度图像绘制技术,生成输入视频图像I1和下一帧视频图像I2的左右格式的3D视图:
6a)利用上述参数分别计算视频图像I1和下一帧视频图像I2在像素位置x处的左眼视点L1(x)和L2(x):
其中,f表示估计的拍摄输入视频的摄像机的焦距,f=50,t表示人的两只眼睛的间距,t=6;
6b)根据各个像素位置的左眼视点得到左眼视图Lz,以输入的视频图像Iz为右眼视图,得到左右格式的3D视图{Lz,Iz},z=1,2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410010043.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有油量提醒功能的机油箱
- 下一篇:保温热水机