[发明专利]一种基于改进端到端神经网络的室内物体目标检测方法在审
申请号: | 202010039334.5 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111275082A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 陈略峰;吴敏;曹卫华;张平平 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 易滨 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 端到端 神经网络 室内 物体 目标 检测 方法 | ||
本发明公开了一种基于改进端到端神经网络的室内物体目标检测方法,利用标注框标注训练集中每一个目标,获取到训练集中每一个目标的类别和位置信息;对卷积神经网络进行初始化,对训练集进行预处理;将预处理后的训练集图像分割成M×N的网格;利用网格进行选取初始候选框;对每个网格进行目标的检测,得到目标类别的类别置信度;根据类别置信度设置卷积神经网络输出,得到最终预测框;训练卷积神经网络,得到训练完成的卷积神经网络;利用训练好的卷积神经网络对待检测目标的图像进行测试,从而确定目标物体的类别和定位。本发明在神经网络中提出了先池化后卷积的特征提取模式,减少特征信息的损失的同时实现快速的室内目标检测。
技术领域
本发明涉及图像识别领域,更具体地说,涉及一种基于改进端到端神经网络的室内物体目标检测方法。
背景技术
智能机器人需要运行在环境、气候、天气、光照、景物都实时变化的复杂环境中,而且运行过程中可能会存在姿态各异,行动不定的行人、障碍物等外界因素。这些因素给机器人带来了很大的挑战性,因此对于智能移动机器人环境感知算法的研究具有很大的意义和难度。室内空间是智能情感机器人常见的工作场景。相比室外环境,室内环境往往更加繁杂,使得机器人对环境的理解更加困难。除此之外,现代社会人们对物品的个性化需求使得物体的外形各式各样,差异很大,这也是环境理解的挑战之一。将环境中的物体建立描述以及与周边物体的关系,对情感机器人的任务执行有着重要的意义。例如机器人的导航需要物体的识别和定位、人机面部和手势的交互需要对周围环境的感知(包括物体和人)和对进行交互的人的识别与追踪。环境感知的建立是机器人也是认知环境的重要一步,为机器人后续的多样化操作提供信息支持。场景对象通常包括人、桌子、椅子等等。当它们出现在同一个场景中时,检测的难度显著增加,尤其是复杂的室内环境。因此,在复杂的室内环境中准确检测物体是环境传感技术的难点之一。
室内物体的目标检测由候选框的提取、待测目标检测、物体目标的检测识别与定位三部分组成。其中,物体目标检测技术经过几十年的研究发展,在检测精度和速度上都取得了很大的进展。主流的检测主要有可变形部件(Deformable Part Models,DPM)、深度网络(Deep Network,DN)、决策树(Decision Forest,DF)。传统的检测方法基于人工设计的特征提取器,通过提取Haar特征、方向梯度直方图(Histogram of Oriented Gradient,HOG)、局部二值模式(Local Binary Pattern,LBP)等训练分类器,以达到物体检测的目的。但人工设计的检测特征很难适应动态物体的大幅度变化。深度网络可以从图像像素中学习特征,提高物体检测器性能。深度网络也在行人检测领域得到了深入运用,随着大规模训练数据集的构建以及硬件计算能力的不断增强,深度网络结构在不同的视觉任务中取得了巨大的成功。在目标检测方面,主要分为一阶段RCNN(Region-CNN)、Fast-RCNN、Faster RCNN系列和二阶段的检测YOLO(You Only Look Once)、SSD(Single Shot MultiBox Detector)、CORNER NET,目标检测的准确率和速度都达到了新的高度。其中YOLO神经网络是目前最优秀的目标检测架构之一,在检测实时性方面表现尤为突出。
基于学习的特征表达方法受到了广泛的关注和研究,与人工设计的特征相比,由于深度学习特征是通过构建深层的网络结构,直接从原始图像像素中提取得到,故其将特征设计问题转换为了网络架构问题。极大地减少不必要的特征设计细节,同时深度神经网络的高层特征映射也显示出一定的语义属性,在PASCAL VOC、Image Net大规模视觉识别挑战赛等相关国际赛事中,基于深度学习的取得了最好的效果。虽然深度学习特征表达具有更本质的特征表现,但由于学习深层神经网络涉及了大量的参数,网络的训练需要大量的数据,因此计算过程比较繁重,需要进一步优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010039334.5/2.html,转载请声明来源钻瓜专利网。