[发明专利]基于自编码器与YOLO算法的高清图像小目标检测方法有效
申请号: | 202010143805.7 | 申请日: | 2020-03-04 |
公开(公告)号: | CN111126359B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 吴宪云;孙力;李云松;王柯俨;刘凯;雷杰;郭杰;苏丽雪;王康;司鹏辉 | 申请(专利权)人: | 西安电子科技大学;南京亿芯亿意信息科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06N3/0455;G06N3/0464;G06N3/048;G06N3/084;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;黎汉华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编码器 yolo 算法 图像 目标 检测 方法 | ||
本发明公开了一种基于自编码器与YOLO算法的高清图像小目标检测方法,主要解决现有技术对高清图像小目标检测其准确率和速度不可兼顾的问题。实现步骤为:1)采集高清图像并标注,获得训练集和测试集;2)对标注好的训练集进行数据扩充;3)根据标注信息生成对应的Mask数据;4)搭建自编码器模型;5)使用训练集对其训练;6)将训练好的自编码器的编码网络与YOLO‑V3检测网络拼接,得到混合网络并使用训练集对其训练;7)使用训练好的混合网络在测试集上进行目标检测。本发明减少了目标检测的计算量,提高了检测速度,并在保证检测速度的情况下提高了高清图像中小目标的检测精度,可用于无人机航拍图像的目标识别。
技术领域
本发明属于目标检测技术领域,特别涉及到一种高清图像小目标的检测方法,可用于无人机航拍图像的目标识别。
技术背景
目前,随着目标检测技术的发展,特别是近几年,基于深度学习的目标检测算法的提出,例如Faster-RCNN、SSD系列、YOLO系列,这些算法与传统目标检测算法相比,基于深度学习的目标检测算法在准确率以及效率上都大大超过了传统检测算法。但是目前的算法都是基于现有的数据集进行优化,如ImageNet、COCO等,在实际应用中,如无人机航拍目标检测,由于无人机飞行高度较高,采集到的图像尺寸较大,一般都为高清图像,并且在采集到的图像中,目标尺寸一般较小,所以在对于高清图像的目标检测方面主要为小目标检测。
在目标检测中,对于高清图像的处理方式主要有两种,一种为下采样尺寸缩放的方式,一种为图像裁剪的方式,具体如下:
Joseph Redmon等人发表在IEEE国际计算机视觉与模式识别会议的非专利文献“YOLO9000:Better,Faster,Stronger”中提出对于YOLO网络的改进方案中通过去掉全连接层的方式,使得网络可以检测不同尺寸大小的输入图像,该方法在使用VOC2007+VOC2012的数据集的实验结果中,通过下采样尺寸缩放的方式将输入图像缩放到288x288大小时,速度上可以达到91FPS,但是在精度上只有69.0mAP,如果将输入图像缩放到544*544大小时,速度降低为40FPS,精度提升为78.6mAP。从该实验中可以看出,大尺寸输入图像目标检测势必会造成计算量的加大,从而降低目标检测的速度,而通过下采样尺寸缩放的方式,又会造成目标空间信息的丢失,降低目标检测的精度。在高清图像的小目标检测中,如果将高清图像直接送入网络中检测,检测速度将会下降更为严重,如果通过尺寸缩放的方式,将会减少小目标特征信息,造成精度下降。
第二种常用方式为图像裁剪,具体做法为:将原始高清图像裁剪为小图送入网络进行检测,检测完毕之后进行合并。这种方式具有的优点是,通过裁剪,保证了图像的空间信息不损失,在目标检测精度上会有很好的效果,但是由于将一幅图像裁剪成了多幅图像,在目标检测速度上将会成倍的增加。
综上所述,如何在实际应用中,对高清图像进行快速又精确的目标检测成为一项有待解决的问题。
发明内容
本发明的目的在于针对上述现有方法存在的缺陷,提供一种基于自编码器和YOLO算法的高清图像小目标检测方法,旨在保证不降低高清图像检测速度的条件下,提高高清图像小目标的检测精度。
为实现上述目的,本发明的技术方案包括如下步骤:
(1)采集高清图像数据形成数据集,并对数据集进行标注,得到正确的标签数据,将数据集和标签数据以8:2的比例划分为训练集和测试集;
(2)将标注好的训练集进行数据扩充;
(3)对于每一幅高清图像数据,根据图像大小和标注信息,生成相应图像的目标Mask数据;
(4)搭建一个包括编码网络和解码网络的全卷积自编码器模型,该编码网络用于对高清图像进行特征提取和数据压缩,该解码网络用于对压缩后的特征图恢复到原始大小;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学;南京亿芯亿意信息科技有限公司,未经西安电子科技大学;南京亿芯亿意信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010143805.7/2.html,转载请声明来源钻瓜专利网。