[发明专利]基于无监督深度学习的单目图像景深实时计算方法有效

专利信息
申请号: 201910256117.9 申请日: 2019-04-01
公开(公告)号: CN110009674B 公开(公告)日: 2021-04-13
发明(设计)人: 仲训昱;杨德龙;殷昕;彭侠夫;邹朝圣 申请(专利权)人: 厦门大学;厦门万久科技股份有限公司
主分类号: G06T7/593 分类号: G06T7/593
代理公司: 桂林市持衡专利商标事务所有限公司 45107 代理人: 陈跃琳
地址: 361102 福建省厦门*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 监督 深度 学习 图像 景深 实时 计算方法
【说明书】:

发明公开一种基于无监督深度学习的单目图像景深实时计算方法,利用双目序列图像之间的几何约束关系构造监督信号,取代传统的人工标记数据集,完成了无监督算法设计;在Depth‑CNN网络中的,损失函数除了考虑图像之间的几何约束,还设计了针对左右图像的景深估计结果一致性约束项,提高算法精确度;以Depth‑CNN的输出作为Pose‑CNN输入的一部分,构造整体的目标函数,同时使用双目图像之间的几何关系和序列图像之间的几何关系构造监督信号,进一步提高的算法的精确度以及鲁棒性。

技术领域

本发明涉及人工智能技术领域,具体涉及一种基于无监督深度学习的单目图像景深实时计算方法。

背景技术

摄像机由于其低廉的采购价格,实时获取场景完整信息等特点,被广泛应用于服务机器人、自主导航机器人以及无人驾驶汽车的场景感知技术研究中。随着高性能计算设备的发展,使用深度神经网络分析2D图像信息的人工智能技术在无人驾驶以及机器人导航等领域日益发挥着不可替代的作用。其中基于单目图像的场景景深实时计算问题是三维场景感知技术的前提。DavidEigen在2014年首先使用深度神经网络计算2D图像所对应的场景景深,建立了2D到3D的映射关系。

目前,基于单目图像的场景景深计算算法主要分为有监督算法和无监督算法两类。有监督算法需要大量带有人工标记的数据,在文献“D.Eigen,C.Puhrsch,andR.Fergus.Depth map prediction from a single image using a multi-scale deepnetwork.In NIPS,2014.”中,David Eigen提出了使用两个深度卷积神经网络分步骤对图像进行粗估计和精细估计的方法获取场景景深。但是此类人工标记数据多依靠激光扫描仪,采集成本高,且不易获取,使用范围有限。无监督算法仅仅使用针对场景的场景图像作为训练集,应用广泛,在文献“T.Zhou,M.Brown,N.Snavely,and D.G.Lowe.Unsupervisedlearning of depth and ego motion from video.In CVPR,2017.”中,Zhou Tinghui等人使用序列图像作为输入,不需要人工标记即可直接计算场景景深。但是由于深度神经网络仅仅通过大量图像分析场景信息,获取场景景深,精确度无法达到指定要求。

通过对以上问题的分析发现:它们或者需要大量人工标记图像作为训练数据集,或者无法完成精确计算的要求,在细节上存在不同程度的丢失。高精度实时景深计算结果在基于图像的无人驾驶应用场景中具有重要意义,因此,需要开发一种无监督的无人驾驶场景景深实时计算方法。

发明内容

本发明针对室外无人驾驶汽车或无人自主机器人中的三维场景感知问题,人工标记数据集不容易大量获取以及应用场景有限等问题,提供一种基于无监督深度学习的单目图像景深实时计算方法,其仅仅使用无人标记图像作为训练数据集,完成精确、快速估计场景景深的方法。

为解决上述问题,本发明是通过以下技术方案实现的:

基于无监督深度学习的单目图像景深实时计算方法,包括步骤如下:

步骤1、使用无人驾驶数据集KITTI中的双目序列图像作为输入数据,并通过数据预处理将双目序列图像分类为两种类型,即用于景深估计卷积神经网络的立体图像对和用于相机姿态估计卷积神经网络的序列图像;

步骤2、基于残差网络建立景深估计卷积神经网络,构造一个端到端系统,以立体图像对作为输入,输出对应的景深估计图像,设计景深估计卷积神经网络对应的损失函数用于反馈传播;

步骤3、基于卷积神经网络模块建立相机姿态估计卷积神经网络,构造一个端到端系统,以序列图像和景深估计图像作为输入,输出序列图像之间的姿态变化矩阵,设计相机姿态估计卷积神经网络对应的损失函数用于反馈传播;

步骤4、基于步骤2所设计的景深估计卷积神经网络对应的损失函数和步骤3所设计的相机姿态估计卷积神经网络对应的损失函数,构造目标函数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学;厦门万久科技股份有限公司,未经厦门大学;厦门万久科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910256117.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top