[发明专利]一种基于图像分区的道路行人小目标检测方法在审

申请号：	202110445828.8	申请日：	2021-04-23
公开（公告）号：	CN113011390A	公开（公告）日：	2021-06-22
发明（设计）人：	袁国慧;叶涛;王卓然	申请（专利权）人：	电子科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06T3/40
代理公司：	成都正煜知识产权代理事务所(普通合伙) 51312	代理人：	李龙
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于图像分区道路行人目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于图像分区的道路行人小目标检测方法，涉及图像处理、目标检测及深度学习技术领域；主旨在于将直接检测问题转化为分区检测再拼接问题，有效解决了直接检测小目标行人效果差的问题，提升了检测算法对大图像中小目标行人检测的能力。主要方案包括S1：构建行人分区数据集；S2：使用S1的行人分区数据集训练输入大小为608×608的行人检测网络模型；S3：输入待检测图像；S4：对S3中的待检测图像进行分区；S5：对S4中所有分区子图像按分区的先后顺序，使用S2中训练好的行人检测模型进行检测；S6：对S5中的所有分区子图像的检测结果按S4中分区的先后顺序进行拼接，将分区子图像的检测结果还原到待检测图像上；S7：输出检测结果。

技术领域

本发明涉及图像处理、目标检测及深度学习技术领域，尤其是一种基于图像分区的道路行人小目标检测方法。

背景技术

行人检测是目标检测中一个重要的问题，其需要在视频或数字图像中检测行人的位置。行人检测作为目标检测问题的一个分支，涉及到检测特定的人类类别，其在视频监控、自动驾驶、人员识别、机器人等领域有着广泛的应用。

行人小目标检测问题在行人检测任务中一直是难点，主要是行人小目标在图像中模糊、分辨率低和携带的信息少，因此导致特征表达能力弱，在特征提取的过程中，能提取到的特征非常少，所以行人小目标的检测精度通常只有行人大目标的一半。一般的小目标检测方案主要包括：采用图像金字塔和多尺度滑动窗口，如MTCNN、FPN和Feature-FusedSSD等；采用数据增强手段，如过采样和复制粘贴小目标；采用不同的训练策略，如SNIP、SNIPER和SAN等：采用先放大特征再检测的检测策略，如GAN网络去检测小目标。这几种策略一般都是针对COCO或ImageNet等通用数据集或图片原始尺寸较小下进行的，如典型的Faster R-CNN模型输入通常是1000×600像素的图像，SSD模型的输入通常是300×300或512×512像素的图像，YOLO模型通常是在416×416或608×608像素的图像上运行。因此如果目标数据集的像素过大，直接使用上述方法一样很难检测到小目标，主要是由于小目标的尺寸一般小于32×32像素或其宽高是原图宽高的十分之一以下。同时，受制于硬件性能的情况下，将大图像的尺寸缩放到与模型大小相匹配后，小目标极有可能消失或仅占有几个像素；进一步，送入到检测模型中后，在模型的深层特征上基本很难提取到小目标的特征信息。

发明内容

本发明的目的在于：本发明提供了一种基于图像分区的道路行人小目标检测方法，克服现有方法在面对数据集像素过大的情况下检测小目标行人易漏检的问题，提高行人小目标的检测能力。

本发明采用的技术方案如下：

一种基于图像分区的道路行人小目标检测方法，包括如下步骤：

步骤1：构建行人分区数据集；

步骤2：使用步骤1的行人分区数据集训练输入大小为608×608的行人检测网络模型；

步骤3：输入待检测图像；

步骤4：对步骤3中的待检测图像进行分区，得到包含分区先后顺序的分区子图像；

步骤5：对步骤4中所有分区子图像按分区的先后顺序，使用步骤2中训练好的行人检测模型进行检测；

步骤6：对步骤5中的所有分区子图像的检测结果按步骤4中分区的先后顺序进行拼接，将分区子图像的检测结果还原到待检测图像上；

步骤7：输出检测结果。

优选地，所述步骤1中的行人分区数据集构建如下：