[发明专利]对室内近距离行人进行识别的方法、装置、介质和机器人在审
申请号: | 202011570406.5 | 申请日: | 2020-12-26 |
公开(公告)号: | CN112597915A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 秦豪;赵明 | 申请(专利权)人: | 上海有个机器人有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 梁秀秀 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 室内 近距离 行人 进行 识别 方法 装置 介质 机器人 | ||
本发明公开了一种对室内近距离行人进行识别的方法、装置、介质和机器人,方法包括以下步骤:采集室内的近距离行人图像,形成训练集;构建基于YOLO‑spp算法的骨干网络和检测头模块,生成行人检测网络模型;采用训练集的图像进行训练,优化行人检测网络模型的网络参数;采集室内的实时行人图像,并基于训练完成的行人检测网络模型对行人位置和行人尺寸进行检测。本发明通过将多个空间金字塔池化模块嵌入到骨干网络,同时采用NMS后处理算法过滤冗余框,从而能够不依赖完整人体结构,仅通过识别衣着等部分特征完成对近处行人的感知识别,提高移动机器人视角下室内近距离行人识别的准确率。
技术领域
本发明涉及机器人领域,尤其涉及一种对室内近距离行人进行识别的方法、装置、介质和机器人。
背景技术
随着机器人行业的快速发展,各种服务机器人层出不穷,机器人在我们的生活、工作中也应用得越来越广泛。机器人设备在室内环境移动过程中,需要感知机器人自身周围环境信息,如墙体,障碍物等。通常来说,行人这类可移动非固定的环境障碍物信息,影响机器人在室内中运动效率,能否有效的感知机器人周边近处行人信息是提升机器人智能化的关键。近年来,随着深度学习的发展,出现了很多基于深度卷积神经网络的行人检测的方法,在公开数据集或自动驾驶等领域都有很广泛的应用。在室内机器人领域,因机器人其特殊的视角,对于机器人近处行人,摄像头设备通常不能捕捉到完整的人体,如人脸或人腿通常捕捉不到,画面呈现的是大面积的衣服,行人在近距离移动时,画面变化较大,容易产生模糊的人影,且每个人的穿着又是一个多变的属性,近处行人的这些特点对室内机器人近处行人检测提出了很大的挑战。
发明内容
本发明提供了一种对室内近距离行人进行识别的方法、装置、介质和机器人,解决了对室内机器人的近处行人检测准确率不高的技术问题。
本发明解决上述技术问题的技术方案如下:一种对室内近距离行人进行识别的方法,包括以下步骤:
步骤1,采集室内的近距离行人图像,并对所述近距离行人图像进行预处理,形成训练集;
步骤2,构建行人检测网络模型,所述行人检测网络模型包括基于YOLO-spp算法的骨干网络和检测头模块;
步骤3,采用所述训练集的图像对所述行人检测网络模型进行训练,优化所述行人检测网络模型的网络参数;
步骤4,采集室内的实时行人图像,并基于训练完成的行人检测网络模型对所述实时行人图像中的行人位置和行人尺寸进行检测。
在一个优选实施方式中,所述骨干网络的网络结构按计算单元处理顺序为:
第一卷积层,输入尺寸416*416*3,输出尺寸208*208,输出特征通道数为32通道;
第二卷积层,输入尺寸208*208*32,输出尺寸104*104,输出特征通道数为64通道;
第一空间金字塔池化层,包括池化窗口为7*7和11*11的两个最大池化层;
第三卷积层,输入尺寸为104*104*64,输出尺寸52*52,输出特征通道数为256通道;
第四卷积层,输入尺寸为52*52*256,输出尺寸26*26,输出的特征通道数为256通道;
第二空间金字塔池化层,包括池化窗口为3*3、7*7以及11*11的三个最大池化层,输出特征图为13*13*1024。
在一个优选实施方式中,所述采用训练集的图像对行人检测网络模型进行训练,优化行人检测网络模型的网络参数,具体包括以下步骤:
S301,对所述行人检测网络模型进行初始化,生成初始权重和初始偏置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海有个机器人有限公司,未经上海有个机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011570406.5/2.html,转载请声明来源钻瓜专利网。