[发明专利]一种基于单目的视觉里程计实现方法和系统在审
申请号: | 201711439472.7 | 申请日: | 2017-12-27 |
公开(公告)号: | CN109978924A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 李方敏;彭小兵;赵奇;杨志邦;栾悉道 | 申请(专利权)人: | 长沙学院 |
主分类号: | G06T7/269 | 分类号: | G06T7/269;G06T7/73;G06T3/40 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 410003 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 里程计 下采样 光度误差 视觉 光流 扭曲 双线性插值法 多维运动 估计矩阵 算子 实时性 视频 相机 | ||
1.一种基于单目的视觉里程计实现方法,其特征在于,包括以下步骤:
(1)通过相机获取视频中的连续两幅照片,并使用卷积神经网络对其中的第一幅照片I1进行估计,以得到估计后的光流照片,该照片是用以下估计矩阵w1表示:
w1=(u1,v1)T
其中u1和v1分别表示估计得到的照片中像素点的横坐标和纵坐标。
(2)根据估计后的照片并使用双线性插值法对第二幅照片I2进行处理,以得到扭曲图并根据扭曲图和第一幅照片得到光度误差e1:
(3)将第一幅照片I1、第二幅照片I2、估计矩阵w1、以及光度误差e1输入到另一个卷积神经网络中,以得到另一幅估计后的光流照片,该照片用估计矩阵w2表示;
(4)对步骤(3)中得到的另一幅估计后的照片进行下采样处理,将下采样处理后的照片平均分成多个子图,将下采样后的照片以及所有子图输入到另一个卷积神经网络中,以得到多维运动描述算子;
(5)对于视频中的其余图片,重复上述步骤(1)至步骤(4),直到所有图片均处理完毕为止,得到的多个多维运动描述算子构成相机的运动轨迹。
2.根据权利要求1所述的视觉里程计实现方法,其特征在于,步骤(1)和步骤(3)中的卷积神经网络均采用六层卷积神经网络。
3.根据权利要求1所述的视觉里程计实现方法,其特征在于,步骤(4)中的卷积神经网络采用2层卷积神经网络。
4.根据权利要求1所述的视觉里程计实现方法,其特征在于,多维运动描述算子包括6个,分别是三维坐标,以及分别围绕X、Y和Z轴旋转的欧拉角。
5.一种基于单目的视觉里程计实现系统,其特征在于,包括:
第一模块,用于通过相机获取视频中的连续两幅照片,并使用卷积神经网络对其中的第一幅照片I1进行估计,以得到估计后的光流照片,该照片是用以下估计矩阵w1表示:
w1=(u1,v1)T
其中u1和v1分别表示估计得到的照片中像素点的横坐标和纵坐标。
第二模块,用于根据估计后的照片并使用双线性插值法对第二幅照片I2进行处理,以得到扭曲图并根据扭曲图和第一幅照片得到光度误差e1:
第三模块,用于将第一幅照片I1、第二幅照片I2、估计矩阵w1、以及光度误差e1输入到另一个卷积神经网络中,以得到另一幅估计后的光流照片,该照片用估计矩阵w2表示;
第四模块,用于对第三模块中得到的另一幅估计后的照片进行下采样处理,将下采样处理后的照片平均分成多个子图,将下采样后的照片以及所有子图输入到另一个卷积神经网络中,以得到多维运动描述算子;
第五模块,用于对于视频中的其余图片,重复上述第一模块至第四模块,直到所有图片均处理完毕为止,得到的多个多维运动描述算子构成相机的运动轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙学院,未经长沙学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711439472.7/1.html,转载请声明来源钻瓜专利网。