[发明专利]一种基于对抗网络的单目深度估计系统实现方法有效
申请号: | 201910349584.6 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110335299B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 纪荣嵘;郭锋;李珂 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06T7/50 | 分类号: | G06T7/50 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 网络 深度 估计 系统 实现 方法 | ||
一种基于对抗网络的单目深度估计系统实现方法,涉及单目图像深度估计。包括训练阶段和测试,所述训练阶段的具体步骤为:收集用于训练的RGB图像集和前n张图像对应的深度图像集合;根据设计的网络结构初始化生成器网络参数θG和两个判别器网络的参数θPD,θDD;设置训练的迭代次数;所述测试阶段的具体步骤为:导入训练好的生成器网络权重;将一张图像作为输入传递给生成器网络;使用导入的网络权重对输入图像进行计算,网络输出输入图像中每个像素点对应的深度值信息。打破了主动深度感知硬件深度空洞和深度稀疏的瓶颈,并且保持了比较高的深度恢复精度,对场景重建、无人驾驶、增强现实等领域都有着重要的实用价值和意义。
技术领域
本发明涉及单目图像深度估计,尤其是涉及一种基于对抗网络的单目深度估计系统实现方法。
背景技术
当人类看到一张图像时,往往可以很容易地理解其中的场景三维结构。然而,对于目前的计算机视觉系统来说,推断场景的三维结构依然是一个十分困难的问题。确实,从一个较窄的数学视角来讲,从单张图像中恢复出三维结构是不可能的,因为我们无法知道一张图像是对着照片拍摄的(这种情况下所有的深度都应该在一个平面上)还是对着真实三维场景拍摄的。但在现实生活中人们仅仅通过一张照片就可以对照片中的场景深度有非常好的感知,并且在所有可能的深度值中,绝大多数的可能性在现实世界中都是不可能的。因此,单目图像中的深度还是可以被以相当可观的准确率预估的。
借助预估出的深度值,计算机视觉中的很多任务都可以得到相较于仅使用RGB图像时的性能提升。这其中包括重建[1]、识别[2]、语义分割[3]以及人体姿态估计[4]等。通过结合深度信息,这些任务可以更好地区分出物体边界以及相对位置,进而更好地完成相应的任务。
除此之外,相较于使用主动感知的传感器来获取场景深度,基于视觉的深度估计更加灵活,同时也是一个更加低成本的解决方案,尤其是受益于近期基于深度学习的深度估计模型[5,6,7]的成功。伴随《新一代人工智能发展规划》的制定,人工智能领域的相关技术已经升级为国家战略,而从单目图像中恢复深度值则是人工智能和计算机视觉等领域中的重点环节之一。
参考文献:
[1]Silberman N,Hoiem D,Kohli P,et al.Indoor segmentation and supportinference from rgbd images[C].European Conference on ComputerVision.Springer,Berlin,Heidelberg,2012:746-760.
[2]Ren X,Bo L,Fox D.Rgb-(d)scene labeling:Features and algorithms[C].Computer Vision and Pattern Recognition(CVPR),2012 IEEE Conference on.IEEE,2012:2759-2766.
[3]Eigen D,Fergus R.Predicting depth,surface normals and semanticlabels with a common multi-scale convolutional architecture[C].Proceedings ofthe IEEE International Conference on Computer Vision.2015:2650-2658.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910349584.6/2.html,转载请声明来源钻瓜专利网。