[发明专利]融合注意力机制的实时行人检测方法有效

专利信息
申请号: 202110049426.6 申请日: 2021-01-14
公开(公告)号: CN112733749B 公开(公告)日: 2022-04-12
发明(设计)人: 冯宇平;管玉宇;刘宁;杨旭睿;赵文仓;王明甲;刘雪峰;秦浩华;王兆辉;赵德钊 申请(专利权)人: 青岛科技大学
主分类号: G06V40/10 分类号: G06V40/10;G06V10/44;G06V10/762;G06V10/774;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 青岛发思特专利商标代理有限公司 37212 代理人: 江鹏飞
地址: 266000 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 融合 注意力 机制 实时 行人 检测 方法
【说明书】:

发明涉及一种融合注意力机制的实时行人检测方法,属于目标检测领域。本发明为了提高Tiny YOLOV3目标检测算法在行人检测任务中的准确率,对该算法进行研究改进。本发明首先对Tiny YOLOV3的特征提取网络进行深化,增强网络特征提取能力;然后在预测网络的两个检测尺度分别加入通道域注意力机制,对特征图的不同通道赋予不同的权重,引导网络更多关注行人的可视区域;最后,改进激活函数和损失函数并采用K‑means聚类算法重新选择初始候选框。本发明提高了行人的检测精度,保持了较快的检测速度,满足实时性运行需求。

技术领域

本发明涉及一种融合注意力机制的实时行人检测方法,属于目标检测技术领域。

背景技术

随着科学技术的发展,行人检测在日常生活和工业生产中的应用越来越广泛。由于含有行人的图像背景复杂,以及受姿态、穿着和遮挡问题的影响,大大增加了行人检测的难度,而在实际的行人检测系统中,不仅要求较高的准确性,还要求较高的实时性,因此对行人检测的研究具有非常重要的现实意义。

传统的行人检测算法通常采用人工特征提取和分类的方法。例如,期刊《一种融合局部特征行人检测模型》,该方法为不同的身体部位训练具有Haar特征的Adaboost分类器,并采用支持向量机检测行人。期刊《改进特征与GPU加速的行人检测》采用SILTP纹理特征和梯度方向直方图提取人体不同部位的特征,并通过GPU加速实现行人检测。而随着计算机算力的提升,基于卷积神经网络的目标检测算法被陆续提出。目前常用的方法有双阶段检测算法R-CNN系列和一阶段检测算法SSD、YOLO系列。双阶段检测算法利用选择搜索或区域候选网络生成候选区域,再进一步对目标的种类和位置进行预测,提高了目标检测的精度。然而,由于候选区域生成和检测网络分开进行,难以实现实时目标检测。一阶段检测算法直接对目标的种类和位置进行回归,具有较快的检测速度。目前有诸多学者对行人检测展开研究。例如,文献“Learning efficient single-stage pedestrian detectors byasymptotic localization fitting”提出了一种渐进定位拟合模块,利用多个尺度实现行人的渐进定位,提高了检测精度。文献“Dense connection and spatial pyramid poolingbased YOLO for object detection”在YOLOV2的基础上改进特征提取网络,提出了一种基于密集连接和空间金字塔池化结构的YOLO目标检测算法,平衡了检测精度和速度。文献“Pedestrian object detection with fusion of visual attention mechanism andsemantic computation”利用视觉注意力机制和拉普拉斯金字塔融合的方法确定行人显著图,在INRIA数据集上取得了92.78%检测精度。以上方法有效提高了行人检测效果,但并不适合实际场景,对于一些实时性要求较高的场景而言,不仅要求较高的检测精度,还要求较快的检测速度。

YOLOV3算法利用特征金字塔(Feature Pyramid Network,FPN)和残差网络的结构设计有效提高了检测的精度。但该算法网络结构复杂,模型体积较大,难以在嵌入式设备上达到实时性要求。Tiny YOLOV3是YOLOV3的简化版本,网络结构简单,模型体积小,检测速度较快,但是检测精度较低;同时,Tiny YOLOV3利用FPN的结构设计对两个检测尺度的特征图进行融合,但这种方式仅仅是将不同通道的特征进行串联,不能反映出特征图通道之间的重要程度。针对以上问题,本发明对Tiny YOLOV3算法进行优化改进。首先,采用3×3卷积对主干网络进行加深,增强网络的特征提取能力;接着,采用1×1卷积对特征图进行降维,降低模型参数量,并实现跨通道的信息交互;然后,在两个预测网络引入轻量级的通道域注意力机制,利用注意力机制融合不同尺度的信息,对特征图的不同通道赋予不同的权重,引导网络关注行人区域;最后,优化边界框回归损失函数和激活函数并采用K-means聚类算法,重新选择初始候选框。实验结果表明,改进后的Tiny YOLOV3具有更高的行人检测精度,并取得了较快的检测速度,模型参数少,体积小,适合实时和嵌入式应用。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110049426.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code