[发明专利]一种基于有监督数据驱动的单目视频深度估计方法有效
申请号: | 201611092073.3 | 申请日: | 2016-12-01 |
公开(公告)号: | CN106599805B | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 曹治国;李睿博;肖阳;鲜可;李然;张润泽;赵富荣;张骁迪 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 方可 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 数据 驱动 目视 深度 估计 方法 | ||
1.一种基于有监督数据驱动的单目视频深度估计方法,其特征在于,包括以下步骤:
(1)获取样本视频序列以及相应的深度序列,作为训练数据集合;
(2)使用基于跟踪的超像素分割方法对训练数据集合进行分割,提取各个分割单元的z类图像特征;
(3)构建结合卷积神经网络与时空条件随机场的网络模型;
(4)使用步骤(1)中的训练数据集合以及步骤(2)中得到的分割结果与相应特征,对步骤(3)中的深度时空卷积神经网络场模型进行训练,得到训练后的网络模型;
(5)对待估计的视频序列进行分割,提取各个分割单元的特征;
(6)将待估计的视频序列以及步骤(5)的分割结果与相应特征,输入步骤(4)已经训练好的模型中,得到深度序列。
2.根据权利要求1所述的基于有监督数据驱动的单目视频深度估计方法,其特征在于,所述网络模型包括:
特征提取单元,用于对视频序列进行卷积,对卷积响应进行稀疏化和非线性化处理,最后选取最大值作为图像特征;
特征投影单元,用于将图像特征投影到超像素上得到超像素特征;
深度回归单元,用于对超像素特征进行回归得到超像素深度值;
结构化输出单元,用于构建深度概率模型:
其中,X表示视频序列,Y表示深度序列;E表示能量函数;Z()表示归一化因子,定义如下:
Z(X)=∫yexp{-E(Y,X)}dy
符号解释如下:
p表示某个超像素,N表示序列中所有超像素的集合,(p,q)表示超像素对,Π表示存在时空连接的超像素对组成的集合,z表示图像特征的类别数量;
zp(θ)表示超像素p通过以θ为参数的深度回归单元的输出结果,yp表示超像素p最终的深度估计值;
Rpq表示超像素对(p,q)的相似程度,由空间相似程度与时间运动程度组成,βk表示第k类特征的权重,βZ+1表示时间运动程度的权重;表示步骤(2)中得到的z类图像特征的第k类特征,由以上z类图像特征共同组成空间相似程度Tpq表示步骤(2)中得到的超像素对的光流特征,也表示为超像素运动程度
3.根据权利要求2所述的基于有监督数据驱动的单目视频深度估计方法,其特征在于,将卷积特征上采样到原图像尺寸,然后按照超像素分割的划分结果将对应位置的图像特征作为该位置超像素特征。
4.根据权利要求1所述的基于有监督数据驱动的单目视频深度估计方法,其特征在于,所述特征包括颜色特征、纹理特征与运动特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611092073.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置