[发明专利]基于语义增强的多尺度特征金字塔融合的行人检测方法在审
申请号: | 202011281029.3 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112446308A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 王君;朱超;殷绪成 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 皋吉甫 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 增强 尺度 特征 金字塔 融合 行人 检测 方法 | ||
1.一种基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,所述行人检测方法先采用梯形路径增强模型提取图片的多尺度特征,再通过多尺度特征融合模型进行特征融合;
所述梯形路径增强模型为在现有特征金字塔的基础上加入更高层次的特征层来提取更高层次的特征信息;
所述多尺度特征融合模型具体为通过相邻特征层的特征数据相加再级联的方式进行特征融合,以增强不同尺度下的特征信息,同时减少通道数。
2.根据权利要求1所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,所述梯形路径增强模型以ResNet-50为骨干网络,构建自上而下的路径和自下而上的路径,两个路径之间通过水平连接增强每个尺度的特征;自上而下的路径中的特征层表示为{P3,P4,P5,P6},自下而上的路径中的特征层表示为{N3,N4,N5,N6,N7}。
3.根据权利要求2所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,P6层特征数据是由P5层特征数据经过步长为2的3×3卷积操作获得。
4.根据权利要求2所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,N6层特征数据是由N5层特征数据经过步长为2的3×3卷积操作获得。
5.根据权利要求2所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,N7层特征数据是通过步长为2的最大池化操作获得。
6.根据权利要求1所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,所述多尺度特征融合模型的工作过程包括:
S1、相邻的待相加的两个特征层中,上层特征层上采样得到下层特征层的大小,再将两个特征层相加得到对应的特征图;特征层为单数时,最下层特征层不进行相加操作;
S2、采用最近邻插值增加所有特征图的尺度;采用反卷积增加未进行相加操作的特征层的尺度;
S3、对经过尺度增加的特征图和/或特征层进行归一化操作,并使之沿着通道维度级联在一起,输出到检测头进行分类回归。
7.根据权利要求6所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,步骤S2中尺度增加的标准为使级联获得的特征图的大小为H/r×W/r;其中,r是下采样因子,H和W为原始输入图像的高和宽。
8.根据权利要求7所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,下采样因子r取值为4。
9.根据权利要求2所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,所述梯形路径增强模型以ResNet-50为骨干网络提取stage3到stage5的特征图,再分别将stage3到stage5的特征图下采样到尺度8、16和32;之后经过1×1卷积将通道数统一为256;然后再构建自上而下的路径和自下而上的路径。
10.根据权利要求1所述的基于语义增强的多尺度特征金字塔融合的行人检测方法,其特征在于,所述行人检测方法的实际操作工程包括:将ResNet-50作为骨干,并在ImageNet上进行预训练,同时使用Adam优化方法进行优化;
所述行人检测方法适用于Caltech数据集和CityPersons数据集,使用若干GTX 1080TiGPU进行训练;训练前先设置学习率、batchsize以及迭代次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011281029.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电连接器
- 下一篇:一种低纬度城市自动追光型光伏发电板安装结构