[发明专利]一种基于有监督数据驱动的单目视频深度估计方法有效
申请号: | 201611092073.3 | 申请日: | 2016-12-01 |
公开(公告)号: | CN106599805B | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 曹治国;李睿博;肖阳;鲜可;李然;张润泽;赵富荣;张骁迪 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 方可 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 数据 驱动 目视 深度 估计 方法 | ||
本发明公开了一种基于有监督数据驱动的单目视频深度估计方法,包括以下步骤:(1)获取样本视频序列以及相应的深度序列,作为训练数据集合;(2)使用基于跟踪的超像素分割方法对训练数据集合进行分割,提取各个分割单元的特征;(3)构建结合卷积神经网络与时空条件随机场的网络模型;(4)使用训练数据集合以及分割结果与相应特征,对深度时空卷积神经网络场模型进行训练;(5)对待估计的视频序列进行分割,提取各个分割单元的特征;(6)将待估计的视频序列以及分割结果与相应特征,输入已经训练好的模型中,得到深度序列。本发明兼顾时空一致性与层次关系准确性,提高了单目立体视频质量。
技术领域
本发明属于模式识别技术领域,具体涉及一种基于有监督数据驱动的单目视频深度估计方法,用于从单目视频中自动地估计视频序列的深度值。
背景技术
随着科技的发展,3D电影、虚拟现实正在丰富着人们的生活。然而,无论是已经风靡全球的3D电影还是当前方兴未艾的虚拟现实都面临一个严重的问题,那就是目前3D资源的匮乏。因此,通过单目视频预测深度,再通过视点合成得到双目立体视频,成为了解决目前3D资源匮乏的主要方法。
在这一技术途径中,单目视频的深度估计作为其重要的组成部分得到了科研人员的广泛关注。目前主要的单目深度预测方法如下:从运动恢复结构(SFM,structure fromMotion)的深度估计方法[Ozden K E,Schindler K,Gool L V.Multibody Structure-from-Motion in Practice[J].Pattern Analysis&Machine Intelligence IEEETransactions on,2010,32(6):1134-1141]、基于信息采集的深度估计法[Karsch K,LiuC,Kang S B.Depth extraction from video using non-parametric sampling[C]//European Conference on Computer Vision.Springer Berlin Heidelberg,2012:775-788]以及基于有监督学习的深度估计方法[Liu F,Shen C,Lin G.Deep convolutionalneural fields for depth estimation from a single image[C]//Proceedings of theIEEE Conference on Computer Vision and Pattern Recognition.2015:5162-5170]。运动恢复结构(SFM)的深度估计方法对场景结构的要求高,算法复杂度高,无法应对非刚体运动与变化。基于信息采集的估计方法对于数据库已知或相似的场景可以得到很好的结果,但是对于数据库之外的场景缺乏推断能力。基于有监督学习的深度估计方法是机器学习方法的一种,通过对计算机进行深度训练,使其熟悉场景特征与对应深度值之间的关系,从而对其它输入图像进行深度分配,取得了相当准确的结果。但是目前基于机器学习的深度估计方法主要针对单张图片进行预测,若直接用于单目视频深度估计任务中,得到预测结果的时空一致性较差,无法满足用户的需求。
由上述内容可见,在基于有监督学习的深度估计方法中,预测结果的时空一致程度成为了制约深度序列质量的关键。如果能够兼顾深度序列的时空一致性与深度层次关系的准确性就能够极大地提升预测结果的质量,提供更精彩的3D资源。
发明内容
本发明提供一种基于有监督数据驱动的单目视频深度估计方法,以视频数据对网络进行有监督训练,目的在于克服现有方法中存在的问题,得到兼顾时空一致性与层次关系准确性的深度序列预测结果,以提高单目立体视频的质量。
为了实现上述目的,本发明提供一种基于有监督数据驱动的单目视频深度估计方法,包括以下步骤:
(1)获取样本视频序列以及相应的深度序列,作为本发明的训练数据集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611092073.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置