[发明专利]基于多粒度深度特征学习的行人检测方法及装置有效
申请号: | 201810083595.X | 申请日: | 2018-01-29 |
公开(公告)号: | CN108596013B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 鲁继文;周杰;林纯泽 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 粒度 深度 特征 学习 行人 检测 方法 装置 | ||
1.一种基于多粒度深度特征学习的行人检测方法,其特征在于,包括以下步骤:
将输入图像传输至细粒度深度特征生成网络和检测网络;
通过所述细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,并通过所述检测网络得到检测特征;
对所述细粒度深度特征和所述检测特征进行元积,以显著化行人区域的特征和平滑背景区域的特征,并获取多粒度深度特征;以及
根据所述多粒度深度特征得到行人检测结果。
2.根据权利要求1所述的基于多粒度深度特征学习的行人检测方法,其特征在于,所述细粒度深度特征生成网络为像素级别的二分类网络,其中,所述通过所述细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,进一步包括:
将所述输入图像的每一个像素分为背景和行人;
根据所述背景和行人生成行人解析图;
将所述行人解析图转化为所述细粒度深度特征。
3.根据权利要求2所述的基于多粒度深度特征学习的行人检测方法,其特征在于,所述通过所述检测网络得到检测特征,进一步包括:
将多个不同分辨率和感受野的卷积层作为检测层,其中,每个检测层负责预设尺度的目标,以解决行人检测任务中多尺度问题;
将每个检测特征输入检测模块,以得到检测结果图,其中,在所述检测模块引入目标的环境信息。
4.根据权利要求1所述的基于多粒度深度特征学习的行人检测方法,其特征在于,所述多粒度深度特征为:
As,c=Ds,c(M)⊙FS,C,
其中,As,c为多粒度深度特征,M为行人解析图,Ds,c为细粒度深度特征变换操作,s为下采样倍数,c为通道数,FS,C为检测层特征,⊙为元积操作。
5.根据权利要求1-4任一项所述的基于多粒度深度特征学习的行人检测方法,其特征在于,通过以下多任务目标函数训练深度卷积网络:
L=Lbox+λcLconf+λsLseg,
其中,L为目标函数,Lbox为检测框回归函数,λs和λc均为权重,Lconf为分类目标函数,Lseg为行人解析目标函数。
6.一种基于多粒度深度特征学习的行人检测装置,其特征在于,包括:
生成模块,用于将输入图像传输至细粒度深度特征生成网络和检测网络;
第一获取模块,用于通过所述细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,并通过所述检测网络得到检测特征;
第二获取模块,用于对所述细粒度深度特征和所述检测特征进行元积,以显著化行人区域的特征和平滑背景区域的特征,并获取多粒度深度特征;
检测模块,用于根据所述多粒度深度特征得到行人检测结果。
7.根据权利要求6所述的基于多粒度深度特征学习的行人检测装置,其特征在于,所述细粒度深度特征生成网络为像素级别的二分类网络,其中,所述第一获取模块,进一步包括:
划分单元,用于将所述输入图像的每一个像素分为背景和行人;
生成单元,用于根据所述背景和行人生成行人解析图;
转化单元,用于将所述行人解析图转化为所述细粒度深度特征。
8.根据权利要求7所述的基于多粒度深度特征学习的行人检测装置,其特征在于,所述第一获取模块,进一步包括:
解决单元,用于将多个不同分辨率和感受野的卷积层作为检测层,其中,每个检测层负责预设尺度的目标,以解决行人检测任务中多尺度问题;
获取单元,用于将每个检测特征输入检测模块,以得到检测结果图,其中,在所述检测模块引入目标的环境信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810083595.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种障碍物框合并方法、装置及终端
- 下一篇:牲畜行为分析方法及装置