[发明专利]基于深度卷积神经网络的环境语义建图方法有效

申请号：	201811492375.9	申请日：	2018-12-07
公开（公告）号：	CN109636905B	公开（公告）日：	2023-01-24
发明（设计）人：	张云洲;胡美玉;秦操;张维智;张括嘉;张珊珊	申请（专利权）人：	东北大学
主分类号：	G06T17/05	分类号：	G06T17/05;G06T19/20;G06T7/11;G06T7/38
代理公司：	北京易捷胜知识产权代理有限公司 11613	代理人：	韩国胜
地址：	110169 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度卷积神经网络环境语义方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种基于深度卷积神经网络的环境语义建图方法，该方法能够借助深度学习在场景识别方面的优势，与SLAM技术的自主定位优势相结合，构建包含物体类别信息的环境地图。具体地，利用ORB‑SLAM对输入图像序列进行关键帧筛选和帧间位姿估计；利用一种基于Deeplab图像分割的改进方法进行二维语义分割；在卷积网络最后一层的后面引入上采样卷积层；利用深度信息作为门限信号控制不同卷积核的选择，并对齐分割后的图像与深度图，利用相邻关键帧之间的空间对应关系构建三维稠密语义地图。上述方案能够提高图像分割的精度，具有更高的构图效率。

技术领域

本发明涉及数字图像处理领域及计算机视觉领域，具体涉及一种基于深度卷积神经网络的环境语义建图方法。

背景技术

准确地获得环境信息，是移动机器人自主执行任务的关键环节。机器人在运动时可通过SLAM技术形成对周围环境的描述，即环境地图。然而，传统的SLAM构图仅考虑几何数据，无法获取地图中物体的类别与种类，提供的信息不足、特征的区分性比较弱。语义信息包括物体类别、目标检测和语义分割等，可以对场景内容进行理解，帮助机器人以目标为导向执行任务。因此，二者相结合是必然需求。

在结合语义和几何信息进行环境建模方面，最初的研究是将场景标注与SLAM相结合，随后出现了基于数据库的方法。自2015年以来，开始提出机器学习方法或深度学习图像语义理解与SLAM结合的方法。但图像分割部分大多采用FCN，效果不够理想。

在SLAM领域，业内人士构建了基于面元的环境地图，但没有位姿图优化和闭环检测，并且受限于地图房间的大小，地图复杂性与点元的数量成正比。业内人士还接受视觉传感器的图像信息，在局部关键帧集合上进行线束平差法，地图规模增大不会导致算法的复杂性急剧升高，并且当闭环出现之后，进行全局线束平差法优化，可得到全局一致性地图，可在CPU上实现。

语义分割的目的是给图像中的每个像素分配一个类别的标签，是语义建图的重要步骤。深度学习方法可以实现较高精度的语义分割，代表性的方法是全卷积神经网络(FCN)，可以将神经网络的最后几层全连接层替换成卷积层，实现端到端的学习，在任何尺寸的图片上都可以进行预测。后续的图像语义分割方法主要是从三个方面进行改进：(1)采用更深的网络结构。例如，将16层的VGG16网络结构换成101层或152层从而能够表示更复杂的模型，学习到更具有区分性的特征；(2)在预测结果后面加上后处理操作。例如引入条件随机场，可以通过近似均值场推断将其整合到网络中，可以得到端到端的结果，也有一些方法会在条件随机场基础上加入边，物体的检测等额外的信息。(3)采用编码-解码的结构，既可以提取到图像特征也可以保持较大的感受野，但网络的深度也会更深。

在语义构图方面，另外的研究人员提出的SLAM++系统是目前效果较好的语义建图方法，它将点云的特征与预先准备好的物体数据库进行比对，若发现匹配的物体则将对应点云放入地图中。但是，SLAM++只能对预定义的物体进行建图，而且其用于匹配模板模型的特征是手动提取的。此外，一些人认为三维点云的稠密语义分割比较困难，在二维图片上分割效果较好，因而采用基于贝叶斯更新和稠密条件随机场进行2D-3D的标签转换，产生一致的三维语义重构。例如，将语义分割与半稠密的大规模的直接法(Large-Scale Direct)单目SLAM融合，通过超像素分割得到图像中的平面，将平面分割结果与LSD对边缘等比较显著的结果进行融合，得到较稠密的实时建图结果，其缺点是对平面的精确度不够理想。还有研究人员提出用CNN预测深度图，与单目SLAM获得的深度测量融合，从单帧图像中获取语义标签与SLAM融合，得到单一视角下的重构，该方法主要侧重深度预测与融合。业内还存在提出利用稠密的Elastic Fusion构建三维环境地图，以反卷积神经网络进行图像分割，该方法采用稠密的Elastic Fusion建图相对耗时，耗费资源多。

发明内容

针对现有技术中的问题，本发明提供一种基于深度卷积神经网络的环境语义建图方法，该方法提高了图像语义分割效果，能够构建准确、鲁棒的三维环境语义地图，具有更高的构图效率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811492375.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于UAV航测地形数据的噪声处理技术
下一篇：基于BIM技术的混凝土灌注桩施工方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T17-00 用于计算机制图的3D建模
G06T17-05 .地理模型
G06T17-10 .体积绘图，例如：圆柱体、六面体或使用结构实体几何
G06T17-20 .线框绘图，例如：多边法或镶嵌
G06T17-30 .表面绘图，例如：多项式表面绘图

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度卷积神经网络的环境语义建图方法有效

专利文献下载