[发明专利]基于多粒度深度特征学习的行人检测方法及装置有效
申请号: | 201810083595.X | 申请日: | 2018-01-29 |
公开(公告)号: | CN108596013B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 鲁继文;周杰;林纯泽 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 粒度 深度 特征 学习 行人 检测 方法 装置 | ||
本发明公开了一种基于多粒度深度特征学习的行人检测方法及装置,其中,方法包括:将输入图像传输至细粒度深度特征生成网络和检测网络;通过细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,并通过检测网络得到检测特征;对细粒度深度特征和检测特征进行元积,以显著化行人区域的特征和平滑背景区域的特征,并获取多粒度深度特征;根据多粒度深度特征得到行人检测结果。该方法通过使用不同分辨率的特征和引入细粒度特征,有效提高检测的精度和性能。
技术领域
本发明涉及计算机图像处理中的行人检测技术领域,特别涉及一种基于多粒度深度特征学习的行人检测方法及装置。
背景技术
行人检测技术是指通过图像处理及模式识别等算法从给定的图像数据中检测出行人,给予行人坐标位置和置信度。行人检测是计算机视觉中一个重要的研究热点,通常是行为分析,姿态估计,属性分析,智能监控,自动驾驶等实际应用中的核心技术之一。因此,行人检测技术具有极高的科研价值和商业价值,并有大量学者从事行人检测的研究,以及众多有效的行人检测的算法被提出来。
尽管近几年计算机视觉研究者致力于行人检测的研究中,但是行人检测问题依旧挑战性很大。这主要是因为有三个原因:其一,由于目标和监控器的距离,行人的尺度有很大的变动,所以单一尺度的检测器难以应对不同尺度的行人;其次,在自然场景下其他物体(例如:车辆,指示牌等)可能对行人造成不同程度的遮挡,检测系统容易被遮挡物误导,从而导致漏检;另外,在实际应用中大部分行人是以小尺度出现,小目标的特征不明显且分辨率低,导致大量的漏检和误检。给定一张图像,为了得到图片中所有行人的位置,检测器通常有以下三步:第一,对整张图片进行特征提取;其次,使用不同尺度和大小的预选框遍历整张图片;最后,基于预选框中的特征,判断其中是否存在行人,并调整预选框的坐标和大小,从而得到最后的行人检测框。其中,特征提取步骤是行人检测系统最重要的一步,所以,相关技术中的研究方法可以被分为两类:基于手工特征的方法和基于深度特征学习的方法。其中,基于手工特征的方法主要考虑了行人的先验信息,对输入图像进行一系列简单的变化,得到行人特征。相比之下,深度特征学习的方法能够通过大量的数据自主学习出具有高鲁棒性的特征,从而显著性的提升检测精准度。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于多粒度深度特征学习的行人检测方法,该方法可以有效提高检测的精度和性,同时保证了行人检测的实时性。
本发明的另一个目的在于提出一种基于多粒度深度特征学习的行人检测装置。
为达到上述目的,本发明一方面实施例提出了一种基于多粒度深度特征学习的行人检测方法,包括以下步骤:将输入图像传输至细粒度深度特征生成网络和检测网络;通过所述细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,并通过所述检测网络得到检测特征;对所述细粒度深度特征和所述检测特征进行元积,以显著化行人区域的特征和平滑背景区域的特征,并获取多粒度深度特征;根据所述多粒度深度特征得到行人检测结果。
本发明实施例的基于多粒度深度特征学习的行人检测方法,可以根据多粒度深度特征得到行人检测结果,通过使用不同分辨率的特征和引入细粒度特征的方法提高检测技术在复杂场景下对小尺度行人和被遮挡的行人检测精度和性能,同时本技术去除了现有行人检测方法的预选框生成步骤,从而保证了行人检测系统的实时性。
另外,根据本发明上述实施例的基于多粒度深度特征学习的行人检测方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述细粒度深度特征生成网络为像素级别的二分类网络,其中,所述通过所述细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,进一步包括:将所述输入图像的每一个像素分为背景和行人;根据所述背景和行人生成行人解析图;将所述行人解析图转化为所述细粒度深度特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810083595.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种障碍物框合并方法、装置及终端
- 下一篇:牲畜行为分析方法及装置