[发明专利]一种基于深度学习的行人检测方法及系统在审
申请号: | 202110888864.1 | 申请日: | 2021-08-04 |
公开(公告)号: | CN113591735A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 钱瀚欣;胡景晨 | 申请(专利权)人: | 上海新纪元机器人有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 童素珠 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 行人 检测 方法 系统 | ||
1.一种基于深度学习的行人检测方法,其特征在于,包括:
获取指定大小的待检测的行人环境图像;
将所述行人环境图像输入训练好的行人识别神经网络模型;
通过所述行人识别神经网络模型对所述行人环境图进行特征提取,生成预设大小的特征图;
基于所述特征图进行分类检测,当检测到当前滑窗中包含有行人时,将所述当前滑窗作为候选框,当获取到M个候选框时,停止当前的分类检测;其中,M≥1;
基于所述特征图,对每个候选框进行回归处理,调整每个候选框的尺寸,生成对应的检测框;
获取每个检测框的分类得分和回归得分,并基于设置的分类权重和回归权重,获取每个检测框的检测总分;
将所有检测框按照检测总分的高低进行排序,选取检测总分排名靠前的K个检测框作为目标框;其中,K≤M;
输出K个目标框的坐标以及对应目标框中的行人概率。
2.根据权利要求1所述的一种基于深度学习的行人检测方法,其特征在于,所述对每个候选框进行回归处理,调整每个候选框的尺寸,生成对应的检测框具体包括:
对每个候选框的尺寸进行放大或缩小处理,优化所述候选框的定位;每次放大或缩小按照预设步长像素进行操作;
当调整后的当前候选框的IOU值高于将当前候选框放大一步后的IOU值,以及高于将当前候选框缩小一步后的IOU值时,将所述调整后的当前候选框作为检测框。
3.根据权利要求1所述的一种基于深度学习的行人检测方法,其特征在于,所述行人识别神经网络模型的损失函数的计算公式如下:
Loss=αLosscls+βLossreg (1)
其中,所述Losscls为分类损失函数,所述Lossreg为回归损失函数,α为所述分类损失函数的损失系数,β为所述回归损失函数的损失系数。
4.根据权利要求1所述的一种基于深度学习的行人检测方法,其特征在于,所述通过所述行人识别神经网络模型对所述行人环境图进行特征提取,生成预设大小的特征图具体包括:
对所述指定大小的行人环境图进行特征提取,生成初始特征图;
在所述初始特征图基础上,通过若干次卷积和池化,生成不同尺度的特征图;
再对各不同尺度的特征图进行不断上采样,直到得到预设大小的特征图。
5.根据权利要求1或4所述的一种基于深度学习的行人检测方法,其特征在于,所述行人环境图像的指定大小为H×W×3;所述行人识别神经网络模型的输入层接收到H×W×3的行人环境图像后,对其进行特征提取,生成预设大小的特征图具体包括:
通过所述行人识别神经网络模型的主干网络的残差层,生成H/4×W/4的初始特征图;
将所述初始特征图经过2*2卷积、池化,生成H/8×W/8的特征图;
将所述H/8×W/8的特征图经过2×2卷积、池化,生成H/16×W/16的特征图;
将所述H/16×W/16的特征图经过2×2卷积、池化,生成H/32×W/32的特征图;
将H/32×W/32的特征图相加生成新的特征图;
将各特征图不断的上采样,直到得到H/4×W/4的特征图。
6.根据权利要求1所述的一种基于深度学习的行人检测方法,其特征在于,所述M=K=1;则基于所述特征图进行分类检测,当检测到当前滑窗中包含有行人时,将所述当前滑窗作为候选框,当获取到M个候选框时,停止当前的分类检测具体包括:
基于所述预设大小的特征图,通过指定步长的滑窗进行分类检测;
若通过特征比对,判断当前滑窗中包含有人脸特征时,将所述当前滑窗作为候选框,并停止当前的分类检测,进入后续的回归处理步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海新纪元机器人有限公司,未经上海新纪元机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110888864.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铁铝铬过滤材料制备方法
- 下一篇:埋点处理方法和装置