[发明专利]基于深度卷积神经网络的环境语义建图方法有效

专利信息
申请号: 201811492375.9 申请日: 2018-12-07
公开(公告)号: CN109636905B 公开(公告)日: 2023-01-24
发明(设计)人: 张云洲;胡美玉;秦操;张维智;张括嘉;张珊珊 申请(专利权)人: 东北大学
主分类号: G06T17/05 分类号: G06T17/05;G06T19/20;G06T7/11;G06T7/38
代理公司: 北京易捷胜知识产权代理有限公司 11613 代理人: 韩国胜
地址: 110169 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 卷积 神经网络 环境 语义 方法
【说明书】:

发明提出了一种基于深度卷积神经网络的环境语义建图方法,该方法能够借助深度学习在场景识别方面的优势,与SLAM技术的自主定位优势相结合,构建包含物体类别信息的环境地图。具体地,利用ORB‑SLAM对输入图像序列进行关键帧筛选和帧间位姿估计;利用一种基于Deeplab图像分割的改进方法进行二维语义分割;在卷积网络最后一层的后面引入上采样卷积层;利用深度信息作为门限信号控制不同卷积核的选择,并对齐分割后的图像与深度图,利用相邻关键帧之间的空间对应关系构建三维稠密语义地图。上述方案能够提高图像分割的精度,具有更高的构图效率。

技术领域

本发明涉及数字图像处理领域及计算机视觉领域,具体涉及一种基于深度卷积神经网络的环境语义建图方法。

背景技术

准确地获得环境信息,是移动机器人自主执行任务的关键环节。机器人在运动时可通过SLAM技术形成对周围环境的描述,即环境地图。然而,传统的SLAM构图仅考虑几何数据,无法获取地图中物体的类别与种类,提供的信息不足、特征的区分性比较弱。语义信息包括物体类别、目标检测和语义分割等,可以对场景内容进行理解,帮助机器人以目标为导向执行任务。因此,二者相结合是必然需求。

在结合语义和几何信息进行环境建模方面,最初的研究是将场景标注与SLAM相结合,随后出现了基于数据库的方法。自2015年以来,开始提出机器学习方法或深度学习图像语义理解与SLAM结合的方法。但图像分割部分大多采用FCN,效果不够理想。

在SLAM领域,业内人士构建了基于面元的环境地图,但没有位姿图优化和闭环检测,并且受限于地图房间的大小,地图复杂性与点元的数量成正比。业内人士还接受视觉传感器的图像信息,在局部关键帧集合上进行线束平差法,地图规模增大不会导致算法的复杂性急剧升高,并且当闭环出现之后,进行全局线束平差法优化,可得到全局一致性地图,可在CPU上实现。

语义分割的目的是给图像中的每个像素分配一个类别的标签,是语义建图的重要步骤。深度学习方法可以实现较高精度的语义分割,代表性的方法是全卷积神经网络(FCN),可以将神经网络的最后几层全连接层替换成卷积层,实现端到端的学习,在任何尺寸的图片上都可以进行预测。后续的图像语义分割方法主要是从三个方面进行改进:(1)采用更深的网络结构。例如,将16层的VGG16网络结构换成101层或152层从而能够表示更复杂的模型,学习到更具有区分性的特征;(2)在预测结果后面加上后处理操作。例如引入条件随机场,可以通过近似均值场推断将其整合到网络中,可以得到端到端的结果,也有一些方法会在条件随机场基础上加入边,物体的检测等额外的信息。(3)采用编码-解码的结构,既可以提取到图像特征也可以保持较大的感受野,但网络的深度也会更深。

在语义构图方面,另外的研究人员提出的SLAM++系统是目前效果较好的语义建图方法,它将点云的特征与预先准备好的物体数据库进行比对,若发现匹配的物体则将对应点云放入地图中。但是,SLAM++只能对预定义的物体进行建图,而且其用于匹配模板模型的特征是手动提取的。此外,一些人认为三维点云的稠密语义分割比较困难,在二维图片上分割效果较好,因而采用基于贝叶斯更新和稠密条件随机场进行2D-3D的标签转换,产生一致的三维语义重构。例如,将语义分割与半稠密的大规模的直接法(Large-Scale Direct)单目SLAM融合,通过超像素分割得到图像中的平面,将平面分割结果与LSD对边缘等比较显著的结果进行融合,得到较稠密的实时建图结果,其缺点是对平面的精确度不够理想。还有研究人员提出用CNN预测深度图,与单目SLAM获得的深度测量融合,从单帧图像中获取语义标签与SLAM融合,得到单一视角下的重构,该方法主要侧重深度预测与融合。业内还存在提出利用稠密的Elastic Fusion构建三维环境地图,以反卷积神经网络进行图像分割,该方法采用稠密的Elastic Fusion建图相对耗时,耗费资源多。

发明内容

针对现有技术中的问题,本发明提供一种基于深度卷积神经网络的环境语义建图方法,该方法提高了图像语义分割效果,能够构建准确、鲁棒的三维环境语义地图,具有更高的构图效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811492375.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top