[发明专利]一种室内场景下基于改进卷积神经网络的视觉SLAM回环检测方法在审
申请号: | 202310442351.7 | 申请日: | 2023-04-23 |
公开(公告)号: | CN116503649A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 徐晓苏;孟焱迪 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/40;G06V10/82;G06V10/774;G06V10/80;G06V10/74;G06V10/77;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 室内 场景 基于 改进 卷积 神经网络 视觉 slam 回环 检测 方法 | ||
本发明涉及一种室内场景下基于改进卷积神经网络的视觉SLAM回环检测方法,具体如下:S1:改进VGG‑19卷积神经网络模型,添加注意力机制模块使其适用于室内环境下图像特征向量提取,从而获得预处理神经网络;S2:将改进神经网络输出的多维特征向量输入随机森林模型进行训练,输出训练集对应的重构建特征向量;S3:针对测试集图像经S1改进卷积神经网络前向传播、以及S2随机森林投票机制输出获得的重构建特征向量,与训练集重构特征向量集合进行调整余弦相似度距离计算,度量值大于阈值时判定其形成回环,并输出构成的图像特征向量集;本发明克服了采用人工特征点提取图像特征向量时计算量大、实时性差的缺点,采用轻量级机器学习算法提升了特征提取准确率。
技术领域
本发明涉及一种室内场景下基于改进卷积神经网络的视觉SLAM回环检测方法,属于计算机视觉技术,适用于SLAM感知、定位与导航领域。
背景技术
SLAM(simultaneous localization and mapping),也称为CML(ConcurrentMapping and Localization),即实时定位与地图构建技术,或并发建图与定位。该问题可以被描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置和地图进行自身定位,同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航。上述过程中机器人载用的传感器通常包括激光雷达、相机等。其中,相机由于其成本低、便于安装的特点受到了相关领域研究人员的关注。视觉SLAM算法主要包括三个方面:前端里程计、后端优化以及回环检测。回环检测的主要目的是消除视觉里程计相邻帧间的误差累积,即漂移,对后端优化收敛造成的影响。
传统的回环检测算法是依靠视觉图像匹配,通过帧间相似度来判断是否有同一场景出现。常用的方法是特征匹配,它解决了SLAM中的数据关联问题。具体步骤是对相机捕获的视觉图像通过人工设计特征的方式提取特征点,例如SURF特征点、ORB特征点等,获取对应的关键点和描述子信息,通过描述子相似度计算图像匹配程度。传统的回环检测算法是通过词袋模型构建词典对特征描述子进行聚类。上述基于人工设计特征的方式实时性差、计算量大、准确率低,在工程应用中无法达到较好的效果。
随着人工智能的发展,机器学习被广泛应用于计算机视觉、图像处理等技术领域。视觉SLAM算法中的回环检测问题即为一种分类问题,传统的词袋模型也是非监督学习的一种,因而采取神经网络进行物体识别和三维场景判断是回环检测方式的主流趋势。神经网络结构的构建对算法的鲁棒性和实时性有着极为关键的作用,高纬度的网络结构将造成计算性能开销过大,从而无法达到SLAM实时性的要求。
为了解决上述问题,提出一种室内场景下基于改进卷积神经网络的视觉SLAM回环检测方法。
发明内容
本发明旨在解决以上现有技术问题。提出了一种解决人工设计特征点提取在回环检测中准确率下降、实时性低的问题,同时,解决了不适合神经网络结构在特征提取时易出现的过拟合问题。
为解决上述技术问题,本发明提供一种室内场景下基于改进卷积神经网络的视觉SLAM回环检测方法,所述方法包括以下步骤:
S1:改进VGG-19(Visual Geometry Group-19)卷积神经网络模型,添加注意力机制模块使其适用于室内环境下的图像特征向量提取,从而获得预处理神经网络。将室内场景下捕获的训练集图像进行标准化处理后,输入至改进卷积神经网络结构的前向传播中对图像数据集进行特征提取,输出特征向量集合。
S2:将改进神经网络输出的多维特征向量输入随机森林模型进行训练。构建均分固定块模型对单一图像的特征向量块进行有放回重复采样,从而构建多个决策树,组成一个随机森林模型,输出训练集对应的重构建特征向量。
S3:针对测试集图像经S1改进卷积神经网络前向传播、以及S2随机森林投票机制输出获得的重构建特征向量,与训练集重构特征向量集合进行调整余弦相似度距离计算,度量值大于阈值时判定其形成回环,并输出构成的图像特征向量集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310442351.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种山地茶树繁育方法
- 下一篇:防扰动装置、传输设备及图案生成系统