[发明专利]目标检测方法、装置、存储介质及终端有效
申请号: | 202110310610.1 | 申请日: | 2021-03-24 |
公开(公告)号: | CN112699859B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 黄仝宇;胡斌杰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 广州国鹏知识产权代理事务所(普通合伙) 44511 | 代理人: | 葛红 |
地址: | 510641 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 存储 介质 终端 | ||
本发明公开了一种目标检测方法,包括:获取驾驶场景下摄像机所拍摄的图像;将所述图像输入至已训练好的目标检测网络,通过所述目标检测网络对所述图像进行判断和预测,得到目标分类和位置信息;其中,所述目标检测网络采用轻量化的YOLOv5s网络结构作为基础框架,在YOLOv5s主干网络的跨阶段局部网络中嵌入瓶颈注意力机制模块,以及在YOLOv5s主干网络的指定卷积层中采用深度可分离卷积运算。本发明有效地提高了对驾驶场景图像的目标检测精度和速度,且符合驾驶场景下前端轻量化的应用需求。
技术领域
本发明涉及信息技术领域,尤其涉及一种目标检测方法、装置、存储介质及终端。
背景技术
随着人工智能技术的快速发展,涌现一大批基于深度学习的目标检测算法,并被广泛应用于辅助驾驶、视频监控、机器人视觉、工业检测等领域的目标检测任务中。视觉感知是辅助驾驶中道路环境感知的重要组成部分,可自动对摄像机所拍摄图像进行分析,主动预测车辆周围存在的潜在危险状况,如行人是否不按交通规则横穿马路、前方车辆是否突然刹车等。
现有技术在针对驾驶场景下摄像机所拍摄图像进行目标检测时,以YOLOv3算法为基础框架,通过嵌入SENet结构以增强特征映射图的感受野,使网络学习到的特征信息更全面。然而此方法存在以下缺点:
(1)SENet只是在通道维度上对特征进行了筛选加权,无法较好获取的位置关系信息,检测精度欠佳。
(2)YOLOv3算法存在召回率不足,定位不够准确的缺点。与YOLOv1、YOLOv2等之前的版本相比,YOLOv3的精度有所提升,但是检测速度有所下降。
(3)对部分遮挡目标的检测精度较低,难以达到交通道路场景的应用需求。
(4)针对驾驶场景下的目标检测正负样本不均衡问题,模型会过多关注易分样本,导致模型性能较低。
发明内容
本发明实施例提供了一种目标检测方法、装置、存储介质及终端,以解决现技术在对驾驶场景下摄像机所拍摄图像进行目标检测时存在的检测精度、检测速度不高的问题。
一种目标检测方法,包括:
获取驾驶场景下摄像机所拍摄的图像;
将所述图像输入至已训练好的目标检测网络,通过所述目标检测网络对所述图像进行判断和预测,得到目标分类和位置信息;
其中,所述目标检测网络采用轻量化的YOLOv5s网络结构作为基础框架,在YOLOv5s主干网络的跨阶段局部网络中嵌入瓶颈注意力机制模块,以及在YOLOv5s主干网络的指定卷积层中采用深度可分离卷积运算。
可选地,所述目标检测网络在YOLOv5s主干网络的BottleneckCSP1_x层之中嵌入瓶颈注意力机制模块,得到基于瓶颈注意力机制模块的跨阶段局部网络。
可选地,所述目标检测网络将YOLOv5s主干网络中的指定CBH模块替换为MBH模块,所述CBH模块由卷积运算、归一化处理以及激活函数组成,所述MBH模块由基于深度可分离卷积运算的倒置残差模块、归一化处理以及激活函数组成。
可选地,所述基于深度可分离卷积运算的倒置残差模块包括第一单点卷积层、深度卷积层、第二单点卷积层和融合层,其中所述第一单点卷积层和深度卷积层采用BatchNorm操作和非线性ReLU6激活函数,所述第二单点卷积层采用BatchNorm操作而不采用非线性ReLU6激活函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110310610.1/2.html,转载请声明来源钻瓜专利网。