[发明专利]基于注意力U-net的单目视觉里程计方法在审

专利信息
申请号: 202010813907.5 申请日: 2020-08-13
公开(公告)号: CN112115786A 公开(公告)日: 2020-12-22
发明(设计)人: 刘瑞军;王向上;张伦 申请(专利权)人: 北京工商大学
主分类号: G06K9/00 分类号: G06K9/00;G06N3/04;G06N3/08;G01C22/00;G01C21/20
代理公司: 北京中政联科专利代理事务所(普通合伙) 11489 代理人: 郑久兴
地址: 100048*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 注意力 net 目视 里程计 方法
【权利要求书】:

1.一种基于注意力U-net的单目视觉里程计方法,包括:

获取单目图像序列,将相邻的若干图像依次通过镜头边界识别算法,从连续帧中识别出镜头边界,整个模块使用关键帧进行运算,并使用高斯金字塔对原图像进行降维,减少后续计算量。

使用基于注意力的局部特征强化方法,对U-net自编码网络添加注意力机制,将关键帧序列输入到该网络,首先采用基于注意力的方法来区分纹理区域和平滑区域,当定位高频细节的位置时,注意机构用作特征选择器,其增强高频特征并抑制平滑区域中的噪声。

将特征强化后的序列输入到最终的Bi-LSTM中,每个时间戳上,根据tn帧大致推测出tn+1帧的图像作为反向序列的输入,获取每个时间戳的相机位姿。

2.根据权利要求1所述的方法,其特征在于,所述计算关键帧序列方法通过将每一帧划分为16×16大小的非重叠网格来识别每一帧的镜头边界。采用卡方距离计算相邻两帧之间相应的网格直方图差d:

Hi表示第i帧直方图,Hi+1表示第(i+1)帧直方图。I表示两帧中同一位置的图像块。连续两帧之间的直方图平均差计算如下

D为连续两帧的平均直方图差,dk为第k个图像块之间的卡方差。N表示图像中图像块的总数。在直方图差异大于阈值Tshot的帧上识别镜头边界:

将获取到的图片序列使用现有的高斯金字塔实行降维,使用步长为2的卷积,降到原图的1/4。

3.根据权利要求1所述的方法,特征的重建,对多纹理区域进行识别与强化,强化高频细节。Li-1表示第i个卷积层的输入,第i层的输出表示为:

Li=σ(Wi*Li-1+bi)

*指卷积的操作,σ是指非线性激活(ReLU),特征重构网络由特征提取的卷积层、多个堆叠的稠密块和作为上采样模块的亚像素卷积层组成,稠密块由残差模块(Resblock)组成,显示了强大的对象识别学习能力。设Hi为第i个残差模块的输入,输出Fi可表示为:

Fi=φi(Hi,Wi)+Hi

残差块包含两个卷积层。具体来说,残差模块函数可以表示如下

φi(Hi;Wi)=σ2(Wi21(Wi1*Hi))

其中Wi1和Wi2分别为两个卷积层的权值,σ1、σ2表示归一化第i个残差模块Hi的输入是前一个残差模块输出的串联。使用一个具有1×1内核的卷积层来控制应该保留多少以前的状态。它自适应地学习不同状态的权重。第i个残差块的输入表示为:

Hi=σ0(Wi0*[F1,F2,...,Fi-1])

Wi0表示1×1的卷积权重,σ0表示ReLU归一化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010813907.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top