[发明专利]一种引入attention机制的多尺度目标检测方法在审
申请号: | 202010636328.8 | 申请日: | 2020-07-03 |
公开(公告)号: | CN112070713A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 况丽娟;戴宪华 | 申请(专利权)人: | 中山大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 引入 attention 机制 尺度 目标 检测 方法 | ||
本发明涉及一种引入attention机制的多尺度检测技术,涉及图像处理领域,该方法包括采集待测图像,将待测图像导入attention yolo‑v3,attention yolo‑v3是在yolo‑v3基础上进行扩展的,添加一个具有通道注意力机制的SENet,使用现有的检测对目标进行并行预测。将待测图片输入到一个预训练好的神经网络中(darknet‑53+FPN)获得三种尺度的feature map;通过聚类得到三种尺度共九种先验框anchor boxs;feature map网格中的每一点会生成三种候选框bbox;计算预测框与真实框的IOU,为真实框分配一个最佳匹配;再将这些候选的bbox进行分类和边框(BBox)回归,最后nms过滤掉一部分候选的bbox。加入注意力机制训练使得其可以获得高准确率,最后还利用了多尺度训练以及多尺度测试提高了检测精度。
技术领域
本发明涉及图像处理领域,尤其是一种引入attention机制的yolo-v3多尺度检测技术。
目标检测被广泛地应用于行人检测、智能辅助驾驶、智能监控、火焰烟雾检测以及智能机器人等领域,目标检测技术虽然发展迅速,但是也存在很多问题,光照、遮挡、背景混淆、尺度问题一直是目标检测的难点。
深度卷积神经网络在目标检测任务上表现非常出色,这主要归功于大样本和其复杂的形式,深度使得模型拥有了很强的非线性表达能力。但目前的很多目标检测算法将检测过程看成是回归问题来处理,还不能很好的区分前景和背景,容易出现错捡和漏检。针对上述问题,可以利用深度学习进行目标检测,最后结合人工修改少量误检的方式从而更智能、高效的完成此任务。
发明内容
针对上述问题及技术需求,提出了一种基于attention yolo-v3的目标检测方法,该方法不仅利用了经典的实时目标检测检测方法yolo-v3,结合语意信息多加注意力机制,以及结合特征金字塔网络,从而提高了网络检测精度。提出引入注意力机制的Attention-YOLO算法,在特征提取网络中加入通道注意力及空间注意力机制,最终仅增加1.4%的参数量,在不影响实时性的前提下改进了其对于关键特征的提取筛选能力;
本发明的技术方案如下:
一种基于attention yolo-v3的目标检测方法,该attention yolo-v3包括卷积神经网络 darknet-53、具有通道注意力机制的SENet、特征金字塔网络、分类器,方法包括:
采集待测图像,将待测图像输入darknet-53网络,该网络大量使用3*3与1*1卷积层依次连接的形式,并且添加了shortcut连接,其网络结构比复杂,有53个卷积层。
在darknet-53前向传播过程中加入具有通道注意力机制的SENet。步骤是先对 H′×W′×C′的特征输入X进行卷积操作,得到待处理的W×H×C的特征图U.接着对得到的U 分别进行Fsq和Fscale.
Fsq操作:对于每一个通道进行全局平均池化,得到一个1×1×C的特征图z。公式为:
其中,Uc表示的是U的第c个通道。
Fscale操作:将z作为一个全连接神经网络的输入,该神经网络的权重为W. Fex(z,W)表示的是一个全连接层的计算过程。得到不同通道特征图的权重系数s,再通过与U对应通道上的特征图进行相乘,以此来表示不同通道的特征图的重要性程度。具体形式如下式所示:s=Fex(z,W),Xc=Fscale(uc,sc)=sc·uc.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010636328.8/2.html,转载请声明来源钻瓜专利网。