[发明专利]一种基于全卷积神经网络的电影2D转3D方法在审
申请号: | 201710089850.7 | 申请日: | 2017-02-20 |
公开(公告)号: | CN107067452A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 尤鸣宇;朱江;沈春华 | 申请(专利权)人: | 同济大学 |
主分类号: | G06T15/00 | 分类号: | G06T15/00;G06N3/08;G06T7/50 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 宣慧兰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 电影 方法 | ||
1.一种基于全卷积神经网络的电影2D转3D方法,其特征在于,该方法包括如下步骤:
(1)提取拍摄的电影2D视频中的每一帧2D图像;
(2)对每一帧2D图像分别采用全卷积神经网络提取特征值并计算深度值;
(3)对每一帧2D图像分别根据其深度值进行着色生成对应的3D图像;
(4)将所有3D图像依次整合形成3D电影。
2.根据权利要求1所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,所述的步骤(2)包括如下子步骤:
(201)将2D图像分隔成超像素,形成超像素图像;
(202)对超像素图像进行处理和计算得到所述的2D图像的一元部分输出和二元部分输出;
(203)根据2D图像的一元部分输出和二元部分输出进行深度估计得到深度值。
3.根据权利要求2所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,步骤(202)中具体为:
(a)将超像素图像输入至全卷积神经网络,得到多个卷积特征图;
(b)将卷积特征图进行超像素池化,进而得到该2D图像的一元部分输出;
(c)对超像素图像进行计算得到二元部分输出。
4.根据权利要求3所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,所述的全卷积神经网络包括多个依次级联的特征提取基本单元,每个特征提取单元包括依次连接的卷积层和池化层。
5.根据权利要求3所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,步骤(b)中超像素池化具体操作为:首先在卷积特征图上进行上采样操作,使得卷积特征图大小与原始2D图像大小相同,然后,对经过上采样操作后的卷积特征图中的每个超像素区域分别计算特征值的平均值,得到n维特征向量,n为超像素区域的个数,最后,将n维特征向量输入到一元部分计算单元进行计算得到一元部分输出矩阵Z,Z为n维行向量,向量中第p个元素记作Zp,Zp表示第p个超像素区域的一元部分计算值,p=1,2,……n。
6.根据权利要求5所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,步骤(c)具体为:
对于第i个超像素区域,考虑所有与其相邻的所有超像素区域,设其中一个与第i个超像素区域相邻的超像素区域记作第j个超像素区域,分别计算第i个超像素区域和第j个超像素区域之间的K种相似度,得到相似度向量其中i=1,2,……n,对每个超像素区域进行上述操作得到相似度向量,最后将所有相似度向量输入到二元部分计算单元计算得到二元部分输出矩阵R,R为n*n维矩阵,其第p行第q列元素记作Rpq,Rpq表示第p个超像素区域相对于第q个超像素区域的二元部分计算值,p=1,2,……n,q=1,2,……n,n为超像素区域的个数。
7.根据权利要求6所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,所述的一元部分计算单元和二元部分计算单元均包括多个依次连接的全连接层。
8.根据权利要求6所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,步骤(203)具体为:
根据下式求取深度值:
y=(I+D-R)-1Z,
其中y为深度值矩阵,I为n*n维单位阵,D为n*n对角矩阵,其对角元素记作Dpp,p=1,2,……n,y为n维行向量,y中的第i个元素记作yi,yi表示第i个超像素区域的深度值,i=1,2,……n,n为超像素区域的个数。
9.根据权利要求3所述的一种基于全卷积神经网络的电影2D转3D方法,其特征在于,所述的全卷积神经网络为针对不同场景下的全卷积神经网络,所述的不同场景包括室内、室外、白天和夜晚,在进行2D图像转3D图像时,根据该图像选择对应场景下的全卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710089850.7/1.html,转载请声明来源钻瓜专利网。