[发明专利]一种基于有监督数据驱动的单目视频深度估计方法有效

专利信息
申请号: 201611092073.3 申请日: 2016-12-01
公开(公告)号: CN106599805B 公开(公告)日: 2019-05-21
发明(设计)人: 曹治国;李睿博;肖阳;鲜可;李然;张润泽;赵富荣;张骁迪 申请(专利权)人: 华中科技大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 武汉东喻专利代理事务所(普通合伙) 42224 代理人: 方可
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 监督 数据 驱动 目视 深度 估计 方法
【权利要求书】:

1.一种基于有监督数据驱动的单目视频深度估计方法,其特征在于,包括以下步骤:

(1)获取样本视频序列以及相应的深度序列,作为训练数据集合;

(2)使用基于跟踪的超像素分割方法对训练数据集合进行分割,提取各个分割单元的z类图像特征;

(3)构建结合卷积神经网络与时空条件随机场的网络模型;

(4)使用步骤(1)中的训练数据集合以及步骤(2)中得到的分割结果与相应特征,对步骤(3)中的深度时空卷积神经网络场模型进行训练,得到训练后的网络模型;

(5)对待估计的视频序列进行分割,提取各个分割单元的特征;

(6)将待估计的视频序列以及步骤(5)的分割结果与相应特征,输入步骤(4)已经训练好的模型中,得到深度序列。

2.根据权利要求1所述的基于有监督数据驱动的单目视频深度估计方法,其特征在于,所述网络模型包括:

特征提取单元,用于对视频序列进行卷积,对卷积响应进行稀疏化和非线性化处理,最后选取最大值作为图像特征;

特征投影单元,用于将图像特征投影到超像素上得到超像素特征;

深度回归单元,用于对超像素特征进行回归得到超像素深度值;

结构化输出单元,用于构建深度概率模型:

其中,X表示视频序列,Y表示深度序列;E表示能量函数;Z()表示归一化因子,定义如下:

Z(X)=∫yexp{-E(Y,X)}dy

符号解释如下:

p表示某个超像素,N表示序列中所有超像素的集合,(p,q)表示超像素对,Π表示存在时空连接的超像素对组成的集合,z表示图像特征的类别数量;

zp(θ)表示超像素p通过以θ为参数的深度回归单元的输出结果,yp表示超像素p最终的深度估计值;

Rpq表示超像素对(p,q)的相似程度,由空间相似程度与时间运动程度组成,βk表示第k类特征的权重,βZ+1表示时间运动程度的权重;表示步骤(2)中得到的z类图像特征的第k类特征,由以上z类图像特征共同组成空间相似程度Tpq表示步骤(2)中得到的超像素对的光流特征,也表示为超像素运动程度

3.根据权利要求2所述的基于有监督数据驱动的单目视频深度估计方法,其特征在于,将卷积特征上采样到原图像尺寸,然后按照超像素分割的划分结果将对应位置的图像特征作为该位置超像素特征。

4.根据权利要求1所述的基于有监督数据驱动的单目视频深度估计方法,其特征在于,所述特征包括颜色特征、纹理特征与运动特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611092073.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top