[发明专利]一种基于因果注意力的室内视觉导航方法在审
申请号: | 202211273306.5 | 申请日: | 2022-10-18 |
公开(公告)号: | CN115512214A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 罗光春;朱大勇;戴瑞婷;董强;张清扬;张晨曦 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/22;G06V10/762;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08;G01C21/20 |
代理公司: | 成都希盛知识产权代理有限公司 51226 | 代理人: | 陈泽斌 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 因果 注意力 室内 视觉 导航 方法 | ||
1.一种基于因果注意力的室内视觉导航方法,其特征在于,包括以下步骤:
A、数据准备
获取室内视觉图像数据集,所述室内视觉图像数据集包括一组导航轨迹数据,各导航轨迹数据分别包括由位置序列构成的导航轨迹以及导航轨迹上各位置处的视觉图像序列,各视觉图像序列分别包括在对应位置处各个观测方向的图像;
并基于导航轨迹数据,构建到达终点前导航轨迹各位置处的导航方向对应图像所构成的导航图像序列,所述导航方向对应图像为从对应位置的视觉图像序列中,按对应位置到达导航轨迹下一位置的方向所确定的图像;然后,对所有导航轨迹数据的导航图像序列,进行视觉特征提取并聚类,获得聚类中心;
B、通过室内视觉导航模型执行室内视觉导航任务:
B1、以导航起点位置作为初始的当前位置,并随机初始化历史状态特征;
B2、观测当前位置的各个观测方向,获得当前位置的视觉图像序列,提取当前位置视觉图像序列中各图像的视觉特征,并编码获得各观测方向的位置特征,并根据各图像的视觉特征与各聚类中心的距离,获得各图像的全局特征;
B3、将历史状态特征分别融入当前位置视觉图像序列中各图像的视觉特征,获得其各图像的视觉图像特征;
融合各图像的视觉图像特征及其位置特征,并通过自注意力机制,计算当前位置视觉图像序列各图像的自注意力特征;
融合各图像的视觉图像特征和位置特征,构建查询向量;根据各图像的全局特征,构建键向量和值向量,然后,基于构建的查询向量、键向量和值向量,通过因果注意力机制,计算当前位置视觉图像序列各图像的因果注意力特征;
然后,融合各图像的自注意力特征及其因果注意力特征,获得当前位置视觉图像序列各图像的视觉环境状态特征;
B4、根据预设的可导航方向,计算当前位置视觉图像序列中可导航方向的图像的视觉特征与其对应视觉环境状态特征之间的相关性,根据相关性预测当前位置的导航动作;
B5、根据当前位置的导航动作确定导航的下一位置,判定是否到达终点或者是否达到预设的最大导航步数,若是,则结束导航,否则,执行步骤B6;
B6、根据步骤B3获得的当前位置的视觉环境状态特征,以及步骤B4预测的当前位置的导航动作,更新历史状态特征;将当前位置导航动作确定的下一位置以及更新后的历史状态特征作为输入,返回步骤B2。
2.如权利要求1所述的一种基于因果注意力的室内视觉导航方法,其特征在于,按如下步骤训练室内视觉导航模型:
C1、以室内视觉图像数据集作为训练数据集并计算获得聚类中心;
C2、从训练数据集提取一条导航轨迹数据,将其全部或部分作为本轮训练的导航轨迹数据;
C3、从输入的导航轨迹数据中,提取其起点的视觉图像序列,作为初始输入的视觉图像序列,并随机初始化历史状态特征;
C4、以输入视觉图像序列对应位置作为当前位置,提取当前位置视觉图像序列中各图像的视觉特征,并编码获得各观测方向的位置特征,并根据各图像的视觉特征与各聚类中心的距离,获得各图像的全局特征;
C5、将历史状态特征分别融入当前位置视觉图像序列中各图像的视觉特征,获得其各图像的视觉图像特征;然后,计算当前位置的自注意力特征和因果注意力特征,并融合自注意力特征及其因果注意力特征,获得视觉环境状态特征;
C6、根据预设的可导航方向,计算当前位置视觉图像序列中可导航方向的图像的视觉特征与其对应视觉环境状态特征之间的相关性,根据相关性预测当前位置的导航动作;
C7、判定是否到达输入导航轨迹数据的终点,若是,则执行步骤C9,否则执行步骤C8;
C8、根据步骤C5获得的当前位置的视觉环境状态特征,以及步骤C6预测的当前位置的导航动作,更新历史状态特征;从导航轨迹数据中,提取导航轨迹下一位置的视觉图像序列,并将该视觉图像序列以及更新后的历史状态特征作为输入,返回步骤C4;
C9、根据各位置处预设的专家导航动作和预测的导航动作,计算其损失,并根据累计损失对室内视觉导航模型的参数进行更新;
C10、重复步骤C2-C9进行迭代训练,直至满足训练终止条件,获得训练好的室内视觉导航模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211273306.5/1.html,转载请声明来源钻瓜专利网。