[发明专利]一种基于多尺度的行人检测方法有效
申请号: | 202110419108.4 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113269038B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 任健;邵文泽;李海波 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱桢荣 |
地址: | 210046 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 行人 检测 方法 | ||
本发明公开了一种基于多尺度的行人检测方法,第一步运用多尺度特征融合,来更多地学习不同尺度的特征,实现利用浅层的特征将简单的目标的区分开来,利用深层的特征将复杂的目标区分开来的目的;第二步,为了进一步提升网络对于多尺度,尤其是小目标的检测能力,用不同大小的滑窗,使得RPN输出经不同感受野滑窗生成的候选区域。本发明在行人检测方面具有一定的提升,而且比现有技术具有更好的鲁棒性,可以用于小目标行人的检测。
技术领域
本发明涉及计算机视觉图像处理领域,特别是一种基于多尺度的行人检测方法。
背景技术
近年来,计算机视觉技术在深度学习的支持下取得了飞速的发展,吸引了众多研究者投身其中。成千上万的科研人员尽管关注的焦点各不相同,但是最终的目标是一样的:让技术为人服务,或者说解放生产力,或者说提高生活质量。既然技术是为人服务的,因此与“人”相关的研究就显得不可或缺。无论是在学术界还是产业界,与“人”相关的研究都起着主导作用。
行人检测作为人类行为分析、步态识别、智能视频监控和自动驾驶等许多现实任务的第一步和最基本的一步,在过去的十几年中受到了广泛的关注。然而,尽管深度卷积神经网络(deep convolutional neural networks,CNNs)在通用目标检测方面已经取得了很大的进展,得到了较好的效果,但是通用目标检测的重要分支之一的行人检测,却是一个长期以来难以解决的问题。从重要性来讲,行人检测是行人追踪、自动驾驶、安防监控等任务的前提。虽然只有“人”这一单一类别,但我们仍然面临很多挑战,比如检测场景的多样性,行人姿态的复杂性,以及待检测目标可能被遮挡等等。
行人检测在智能监控和安防领域发挥着重大作用,为了防止财产安全和安放部署等,大部分公众场所都装备了监控设备。但是,尽管如此,监控设备中出现的大量行人数据时,仅仅依据专人的查看,会导致以下问题的出现,一方面长时间的监控信息,人与计算机相比,肯定会出现疲惫而导致的信息错误或者遗漏,另一方面有限的处理信息的能力,不能充分将监控信息充分利用。然而人工处理问题的不足,可以通过行人检测的相关技术很好的弥补,既节省了人力也可在遇到紧急状况时及时做出预警。
行人检测技术同时也是无人驾驶领域所要攻克完善的一个重要难题。从无人驾驶技术开始发展,行人检测就一直作为一个亟待解决和完善的问题困扰着众多的研究者。尽管2005年以来行人检测进入了一个快速的发展阶段,但是依旧存在着许多问题有待解决,主要还是两方面,即速度与准确性还不能达到一个权衡。近年来,以谷歌为首的自动驾驶技术研发,正如火如荼地进行着,这也迫切需要能对行人进行有效的快速的检测方法的出现,以保证自动驾驶期间对行人的安全不会产生威胁。因此,行人检测问题的解决能从根本上优化现有的无人驾驶技术。
行人检测(Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪、行人重识别等技术结合,应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。由于行人兼具刚性和柔性的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人检测成为计算机视觉领域中一个既具有研究价值又极具挑战性的热门课题。
小目标是行人检测中一个非常普遍的问题,尤其是在自动驾驶或者监控场景中,当行人目标距离摄像头较远时,对现有算法而言非常具有挑战性。作为通用目标检测中的一个特定问题,现有基于CNN的行人检测方法,依然来源于通用目标检测方法(如Faster R-CNN,SSD),该类方法采用铺设目标候选框的方式完成,称其为anchor-based方法。然而,anchor-based方法存在三个问题:一是需要根据特定数据集人工选定特定的锚点框以更好地匹配行人目标,二是需要人工设定阈值来定义正负样本,三是训练过程中存在基于数据集标注的偏差,尤其对于困难样本和小目标,行人框中的能够提供给网络模型学习到的目标信息本身就十分稀少,这种偏差使得检测器更加难以胜任对困难样本和小目标的检测。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110419108.4/2.html,转载请声明来源钻瓜专利网。