[发明专利]视觉景深估计方法、装置、设备及存储介质有效
申请号: | 201710488104.5 | 申请日: | 2017-06-23 |
公开(公告)号: | CN109118532B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 何明;陈世佳;夏添 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04N13/246 | 分类号: | H04N13/246;G06T7/521 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉 景深 估计 方法 装置 设备 存储 介质 | ||
本发明公开了视觉景深估计方法、装置、设备及存储介质,其中方法包括:获取采集车所采集的图像,根据获取到的图像生成训练样本;根据训练样本训练得到神经网络模型;获取单目摄像机所采集的图像,根据神经网络模型,确定出图像中的各像素点分别对应的景深。应用本发明所述方案,能够满足实时处理的要求等。
【技术领域】
本发明涉及计算机应用技术,特别涉及视觉景深估计方法、装置、设备及存储介质。
【背景技术】
为保障无人驾驶车辆在道路上安全行驶,需要实时获取周围环境障碍物检测以及视觉景深估计等信息,进而反馈给控制系统实现避障、行驶刹车等操作。
目前,通常采用双目立体视觉的方式实现视觉景深估计,如图1所示,图1为现有采用双目立体视觉的方式实现视觉景深估计的原理示意图,可利用双目摄像机得到的同一场景的两幅图像的视差进行景深的计算,具体实现过程通常包括摄像机标定、特征提取、图像匹配以及深度计算等多个步骤,处理方式复杂、计算量大,因此实时性通常很难得到保证,即难以满足实时处理的要求。
【发明内容】
有鉴于此,本发明提供了视觉景深估计方法、装置、设备及存储介质,能够满足实时处理的要求。
具体技术方案如下:
一种视觉景深估计方法,包括:
获取采集车所采集的图像,根据获取到的图像生成训练样本;
根据所述训练样本训练得到神经网络模型;
获取单目摄像机所采集的图像,根据所述神经网络模型,确定出图像中的各像素点分别对应的景深。
根据本发明一优选实施例,所述采集车上安装有双目摄像机,所述获取采集车所采集的图像,根据获取到的图像生成训练样本包括:
针对所述双目摄像机每次采集到的左右目图像,分别进行以下处理:
分别确定出图像中的各像素点对应的景深;
利用左右目图像中的一个单目图像以及其中的各像素点对应的景深组成一个训练样本,所述单目图像为左目图像或右目图像。
根据本发明一优选实施例,所述采集车上安装有单目摄像机以及激光雷达,所述获取采集车所采集的图像,根据获取到的图像生成训练样本包括:
针对所述单目摄像机每次采集到的图像,分别进行以下处理:
获取所述激光雷达采集的对应的点云数据,将所述点云数据通过标定得到的转换矩阵投影到所述图像上;
根据与之对应的点云三维坐标,分别确定出所述图像中的各像素点对应的景深;
利用所述图像以及其中的各像素点对应的景深组成一个训练样本。
根据本发明一优选实施例,所述获取单目摄像机所采集的图像,根据所述神经网络模型,确定出图像中的各像素点分别对应的景深包括:
获取单目摄像机所采集的图像,将所述图像输入给所述神经网络模型,得到所述神经网络模型输出的图像中的各像素点分别对应的景深。
根据本发明一优选实施例,所述根据所述训练样本训练得到神经网络模型包括:
将单目视觉的可视范围等分为N个子区域,N为大于一的正整数;
根据所述训练样本训练得到由分类器以及回归模型组成的神经网络模型,其中,所述分类器用于输出所属子区域信息,所述回归模型用于输出偏移值信息;
所述获取单目摄像机所采集的图像,根据所述神经网络模型,确定出图像中的各像素点分别对应的景深包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710488104.5/2.html,转载请声明来源钻瓜专利网。