[发明专利]一种基于知识蒸馏的快速行人检测方法在审
申请号: | 202010352095.9 | 申请日: | 2020-04-28 |
公开(公告)号: | CN113569882A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 周大可;张志伟;吴子涵 | 申请(专利权)人: | 上海舜瞳科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 上海汉盛律师事务所 31316 | 代理人: | 郭海锋 |
地址: | 201210 上海市浦东新区中*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 快速 行人 检测 方法 | ||
本发明涉及计算机视觉、深度学习、目标检测、模型压缩加速等领域,具体是一种在图像或视频中对行人目标进行快速识别和定位的方法。针对行人检测网络参数量计算量较大,无法达到实时检测的问题,本发明提出一种基于知识蒸馏的快速行人检测方法,将常规的基于卷积神经网络的行人检测模型作为教师模型,通过优化的卷积方式降低其参数量和计算量,得到轻量的检测模型作为学生模型;然后针对检测任务,利用教师模型辅助学生模型的训练,提高轻量模型在复杂场景下的检测性能,从而在不牺牲过多检测精度的基础上加快检测速度,达到实时检测的要求。
技术领域
本发明涉及计算机视觉、深度学习、目标检测、模型压缩加速等领域,具体是一种在图像或视频中对行人目标进行快速识别和定位的方法。
背景技术
随着互联网时代数据信息的极大丰富以及计算设备性能的不断提升,基于图像或视频来模拟人类视觉的计算机视觉技术迅猛发展。目标检测是计算机视觉中的基础任务之一,其主要目的是对图像或视频中的物体进行识别和定位。行人检测由于其检测目标的特殊性,一直是通用目标检测的重要分支。鲁棒Robust、快速的行人检测算法在智能交通、自动驾驶、视频监控、人机交互等领域均有着广泛的应用,同时也是目标跟踪、姿态识别、视频分析、场景理解等高级视觉任务的基础。因此,如何在复杂背景的干扰下稳健、快速的检测行人是计算机视觉技术在实际应用中亟待解决的难题。
卷积神经网络提取的特征相比于手工设计特征具备更好的表达能力和鲁棒性,极大改善了传统行人检测算法在复杂交通场景下由于遮挡、多尺度、光照变化等因素带来的性能降低问题,有效提升了算法的性能。目前基于卷积神经网络的检测算法主要有两类:一是以Faster RCNN为代表的双阶段(two stage)方法和以YOLO(You Only Look Once)为代表的单阶段(one stage)方法。前者首先利用区域建议网络生成可能存在目标的前景区域,然后针对每个区域判断是否是待检测物体,同时进一步微调其位置,是一个由粗到精的过程。后者的基本思路则是利用统一的网络直接回归出待检测物体的类别和位置,本质上是一个密集采样的过程。通常two stage检测算法具备更高的检测精度,但其检测速度相对较慢;得益于更加统一的检测框架,one stage检测算法的检测速度具备一定的优势,但其检测精度会略有降低。在目标检测方法发展的过程中,两类算法相互借鉴、相互融合,算法的性能和速度均取得了长足的进步。
目前,基于卷积神经网络的行人检测算法性能提升显著,在充足训练样本支持下,经典的检测网络如RetinaNet对于遮挡、杂乱背景等问题也具有较好鲁棒性。但是,这些检测网络的参数量、计算量很大,对计算资源要求很高。例如,精度较高的RetinaNet,即使在配备RTX2080的服务器上,其处理速度也难以达到实时检测。在智能交通、自动驾驶和智能监控等领域的实际应用中,行人检测算法通常需要运行于前端的嵌入式设备,而这些设备的计算和存储能力是非常有限的。因此,如何在保证一定检测精度的前提下,对检测网络进行压缩加速从而提高算法的实时性,是当前行人检测算法研究与应用的重要难点。
发明内容
本发明为了解决上述技术问题采用以下技术方案:
一种基于知识蒸馏的快速行人检测方法,包括如下步骤:
一种基于知识蒸馏的快速行人检测方法,其特征在于,包括以下步骤:
一种基于知识蒸馏的快速行人检测方法,其特征在于,包括以下步骤:
步骤1:教师模型设计,在RetinaNet网络基础上,引入小尺度检测模块以及尺度感知损失函数,改善复杂环境下的行人检测效果;
步骤2:教师模型训练,对改进后的RetinaNet进行训练,将训练完成的模型作为教师模型,为后续学生模型的训练提供辅助信息;
步骤3,学生模型生成,通过新型的卷积方式替换教师网络中的传统卷积方式,同时降低生成融合特征图的通道数,生成参数量和计算量较低的轻量学生模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海舜瞳科技有限公司,未经上海舜瞳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010352095.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种布料打卷机及其使用方法
- 下一篇:多模态肿瘤消融探针系统及其控制方法