[发明专利]一种加强SSD小目标行人检测性能的网络结构及检测方法有效
申请号: | 201811474112.5 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109800628B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 胡永健;陈奇华;刘琲贝;王宇飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/40;G06V20/52;G06V10/774;G06V10/764;G06V10/80;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 加强 ssd 目标 行人 检测 性能 网络 结构 方法 | ||
本发明公开了一种加强SSD小目标行人检测性能的网络结构,包括:预处理模块、基础网络模块、附加特征提取模块、两级特征融合模块、分类和回归模块。本发明还公开了一种加强SSD小目标行人检测性能的检测方法,其特征在于,包括以下步骤:获取用于小目标行人检测的训练样本集并转换格式;初始化训练模型,对训练样本进行预处理;提取样本的浅层特征和深层特征,将深层特征的信息融合到浅层特征中,形成多尺度检测框架;进行网络参数的迭代更新;完成网络训练后进行测试。本发明在SSD算法的基础上引入了两级特征融合模块,有效利用了特征层之间的上下文信息,使深层网络信息能够较好地融合到浅层网络中,加强了SSD算法对小目标行人的检测性能。
技术领域
本发明涉及深度学习及行人检测领域,特别涉及一种加强SSD小目标行人检测性能的网络结构及检测方法。
背景技术
行人检测是计算机视觉领域中的一个重要研究分支,主要任务是判断输入的图像或视频序列中是否出现行人,并确定其位置。行人检测技术广泛地应用于视频监控、车辆辅助驾驶、智能机器人等多个领域。
近年来,深度学习方法在目标检测上取得了重大的突破,展现出比传统方法更强大的检测能力。行人检测作为一种特定的目标检测任务,也获益于深度学习技术的快速发展。相比于传统的检测方法,深度学习方法可以从训练数据中自主地学习行人的特征,并且可以实现端到端的检测。2014年Ross Girshick等人在欧洲计算机视觉会议(ECCV)上发表论文《Rich feature hierarchies for accurate object detection and semanticsegmentation》,首次将深度学习引入目标检测领域,相比于传统检测方法,大幅提高了在PASCAL VOC数据集上的检测准确率。2016年发表于计算机视觉和模式识别会议(CVPR)上的论文《You Only Look Once:Unified,Real-Time Object Detection》提出了YOLO算法,不需要区域建议过程,可以达到实时检测,但是检测精度偏低。2016年Wei Liu等人在ECCV会议上发表论文《SSD:Single Shot MultiBox Detector》,所提出的SSD算法也属于无区域建议的方法,利用多尺度检测思想,在提高检测精度的同时满足了实时性。然而,当目标尺度较小时,以上众多经典深度学习方法的检测效果并不理想。这是因为小目标分辨率较低,能被提取的目标特征有限,且更容易受到噪声干扰造成漏检,此外,小目标需要的搜索深度更大,检测速度受到影响。因此,远距离下小目标行人的检测是一个有待解决的技术难点。
SSD算法作为目标检测领域中的一种经典深度学习方法,采用了多尺度检测框架,但是该算法主要依靠Conv4_3层来检测小目标,Conv4_3层属于低级特征,语义区分性较差,存在特征提取不充分的问题,因此SSD算法对小目标的检测效果较差。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种加强SSD小目标行人检测性能的网络结构及检测方法,此网络结构及检测方法可显著提高对小目标行人的检测性能。
本发明的目的通过以下的技术方案实现:
一种加强SSD小目标行人检测性能的网络结构,包括:
预处理模块,用于统一样本尺寸和样本扩增;
基础网络模块,用于提取样本的浅层特征;
附加特征提取模块,用于提取样本的深层特征;
两级特征融合模块,用于将深层特征与浅层特征融合;
分类和回归模块,用于计算损失,实现分类和行人框的回归。
此网络结构是在SSD算法网络结构的基础上进行改进,引入两级特征融合策略,通过引入两级特征融合模块把深层网络的特征融合到浅层网络的特征中,以提升浅层特征的表示能力,增强对小目标行人的检测性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811474112.5/2.html,转载请声明来源钻瓜专利网。