[发明专利]基于深度强化学习的机器人环境识别方法及系统在审
申请号: | 202010781668.X | 申请日: | 2020-08-06 |
公开(公告)号: | CN112115286A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 朱太云;陈忠;杨为;柯艳国;胡迪;赵恒阳;蔡梦怡;张国宝;赵常威 | 申请(专利权)人: | 国网安徽省电力有限公司电力科学研究院;国网安徽省电力有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/583;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;刘兵 |
地址: | 230601 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 机器人 环境 识别 方法 系统 | ||
1.一种基于深度强化学习的机器人环境识别方法,其特征在于,所述方法包括:
基于全局特征对所述机器人即时拍摄的视觉图像进行描述;
基于深度强化学习算法在预设的数据库图像集中对所述视觉图像进行匹配以得到当前的环境识别结果。
2.根据权利要求1所述的方法,其特征在于,基于全局特征对所述视觉图像进行描述具体包括:
将所述视觉图像输入训练好的卷积神经网络中进行前向推理;
对所述卷积神经网络的全局特征进行归一化处理操作得到全局特征向量以作为视觉描述子,其中,所述全局特征包括所述卷积神经网络中每个网络层输出的网络特征。
3.根据权利要求2所述的方法,其特征在于,所述方法进一步包括:
在将所述视觉图像输入训练好的卷积神经网络中进行前向推理前,缩放所述视觉图像至预定尺寸。
4.根据权利要求1所述的方法,其特征在于,基于深度强化学习算法在预设的数据库图像集中对所述视觉图像进行匹配以得到当前的环境识别结果具体包括:
根据所述数据库图像集构建环境地图以形成地点记忆。
5.根据权利要求4所述的方法,其特征在于,根据所述数据库图像集构建环境地图以形成地点记忆具体包括:
将所述数据库图像集中的每个图像分别输入所述卷积神经网络中以得到对应的全局特征向量;
以所述全局特征向量为基础建立树索引;
将所述全局特征向量、对应的所述图像的图像边界框和所述图像的来源关联以形成查询表;
分别根据每个所述全局特征向量生成对应的哈希码以形成哈希码数据库;
将所述查询表、所述哈希码数据库和所述树索引组合以形成所述地点记忆。
6.根据权利要求5所述的方法,其特征在于,所述方法进一步包括:
基于所述树索引对所述视觉图像进行粗匹配;
基于所述查询表和所述哈希码数据库对所述视觉图像进行精匹配。
7.根据权利要求6所述的方法,其特征在于,基于所述树索引对所述视觉图像进行粗匹配具体包括:
根据所述视觉图像的全局特征向量从所述树索引中查询特征相似的Knn-最近邻以构成最近邻集合;
依据所述最近邻集合中的每个图像的全局特征向量和所述视觉图像的全局特征向量的相似度距离对每个所述图像进行第一次投票;
选取相似度较高的前Ktop个所述图像以作为候选最佳匹配图像集。
8.根据权利要求7所述的方法,其特征在于,基于所述查询表和所述哈希码数据库对所述视觉图像进行精匹配具体包括:
根据所述视觉图像的全局特征向量生成对应的哈希码;
分别计算所述视觉图像的哈希码与所述哈希码数据库中的每个所述哈希码的汉明距离以形成汉明空间;
采用线性最近邻搜索的方法在所述汉明空间中寻找最近邻哈希码以构成哈希码最近邻集合;
依据所述哈希码最近邻集合中的每个图像的哈希码和所述视觉图像的哈希码的相似度对每个所述图像进行第二次投票;
选取在所述第二次投票中得到票数最高的所述哈希码对应的图像作为最终的地点识别及结果。
9.一种基于深度强化学习的机器人环境识别系统,其特征在于,所述系统包括处理器,所述处理器被配置为执行如权利要求1至8任一所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有指令,所述指令用于被机器读取以使得所述机器执行如权利要求1至8任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网安徽省电力有限公司电力科学研究院;国网安徽省电力有限公司,未经国网安徽省电力有限公司电力科学研究院;国网安徽省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010781668.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于基尼指数的领域自适应语义分割方法
- 下一篇:一种瓷砖质量检测装置