[发明专利]视觉景深估计方法、装置、设备及存储介质有效
申请号: | 201710488104.5 | 申请日: | 2017-06-23 |
公开(公告)号: | CN109118532B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 何明;陈世佳;夏添 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04N13/246 | 分类号: | H04N13/246;G06T7/521 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉 景深 估计 方法 装置 设备 存储 介质 | ||
1.一种视觉景深估计方法,其特征在于,包括:
获取采集车所采集的图像,根据获取到的图像生成训练样本;
根据所述训练样本训练得到神经网络模型;
获取单目摄像机所采集的图像,根据所述神经网络模型,确定出图像中的各像素点分别对应的景深,包括:针对图像中的每个像素点,分别利用所述神经网络模型获取所述像素点对应的景深的所属子区域信息以及在所属子区域内的偏移值信息,根据所属子区域信息以及偏移值信息计算出所述像素点对应的景深。
2.根据权利要求1所述的方法,其特征在于,
所述采集车上安装有双目摄像机,所述获取采集车所采集的图像,根据获取到的图像生成训练样本包括:
针对所述双目摄像机每次采集到的左右目图像,分别进行以下处理:
分别确定出图像中的各像素点对应的景深;
利用左右目图像中的一个单目图像以及其中的各像素点对应的景深组成一个训练样本,所述单目图像为左目图像或右目图像。
3.根据权利要求1所述的方法,其特征在于,
所述采集车上安装有单目摄像机以及激光雷达,所述获取采集车所采集的图像,根据获取到的图像生成训练样本包括:
针对所述单目摄像机每次采集到的图像,分别进行以下处理:
获取所述激光雷达采集的对应的点云数据,将所述点云数据通过标定得到的转换矩阵投影到所述图像上;
根据与之对应的点云三维坐标,分别确定出所述图像中的各像素点对应的景深;
利用所述图像以及其中的各像素点对应的景深组成一个训练样本。
4.根据权利要求1所述的方法,其特征在于,
所述获取单目摄像机所采集的图像,根据所述神经网络模型,确定出图像中的各像素点分别对应的景深进一步包括:
获取单目摄像机所采集的图像,将所述图像输入给所述神经网络模型,得到所述神经网络模型输出的图像中的各像素点分别对应的景深。
5.根据权利要求1所述的方法,其特征在于,
所述根据所述训练样本训练得到神经网络模型包括:
将单目视觉的可视范围等分为N个子区域,N为大于一的正整数;
根据所述训练样本训练得到由分类器以及回归模型组成的神经网络模型,其中,所述分类器用于输出所属子区域信息,所述回归模型用于输出偏移值信息。
6.根据权利要求5所述的方法,其特征在于,
所述根据所属子区域信息以及偏移值信息计算出所述像素点对应的景深包括:
用所属子区域的起始值加上所述偏移值,得到所述像素点对应的景深;
所述偏移值小于或等于所属子区域的结束值与起始值之差。
7.一种视觉景深估计装置,其特征在于,包括:样本获取单元、模型训练单元以及景深估计单元;
所述样本获取单元,用于获取采集车所采集的图像,根据获取到的图像生成训练样本;
所述模型训练单元,用于根据所述训练样本训练得到神经网络模型;
所述景深估计单元,用于获取单目摄像机所采集的图像,根据所述神经网络模型,确定出图像中的各像素点分别对应的景深,包括:针对图像中的每个像素点,分别利用所述神经网络模型获取所述像素点对应的景深的所属子区域信息以及在所属子区域内的偏移值信息,根据所属子区域信息以及偏移值信息计算出所述像素点对应的景深。
8.根据权利要求7所述的装置,其特征在于,
所述采集车上安装有双目摄像机,所述样本获取单元针对所述双目摄像机每次采集到的左右目图像,分别进行以下处理:
分别确定出图像中的各像素点对应的景深;
利用左右目图像中的一个单目图像以及其中的各像素点对应的景深组成一个训练样本,所述单目图像为左目图像或右目图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710488104.5/1.html,转载请声明来源钻瓜专利网。