[发明专利]一种实时行人检测方法及神经网络、目标检测层有效
申请号: | 201910095995.7 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109840498B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 胡永健;阿尔法西·萨吉尔·艾哈迈德·萨吉尔;刘琲贝;王宇飞 | 申请(专利权)人: | 华南理工大学;中新国际联合研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种实时行人检测方法,该方法的步骤主要包括:确定默认分辨率,读取视频帧,根据缩放因子确定分割块数,调整视频帧尺寸,分割视频帧,将分割后视频帧子块叠放并提取特征,预测候选行人框的坐标参数以及行人置信度分数,筛选出最终的行人框结果,根据当前帧行人尺寸调整缩放因子,继续处理下一帧直至完成全部检测任务。本发明公开了一种神经网络,包括7或8或9层卷积层。本发明还公开了一种目标检测层,该目标检测层实现行人目标框坐标预测和目标框置信度预测两部分功能。本发明通过缩放因子对视频帧进行自适应缩放,在保证检测精度及运算速度的情况下,尤其提高了对小尺寸行人目标的检测效果。 | ||
搜索关键词: | 一种 实时 行人 检测 方法 神经网络 目标 | ||
【主权项】:
1.一种实时行人检测方法,其特征在于,根据视频中行人的尺寸自动对视频帧进行分割,在单幅视频帧上进行单次迭代,输出行人目标框及行人置信度分数;包括如下步骤:确定算法中网络接收视频的默认分辨率:Hd×Wd×3,其中Hd、Wd分别指图像的高度和宽度,3指图像包含的色彩通道数;读取当前帧I,分辨率为H×W×3;根据缩放因子z的值,决定当前帧I的分割块数B;根据缩放因子z和分割块数B,调整当前帧I的尺寸为H′×W′;归一化调整尺寸后的帧中个像素值;分割归一化后的帧为B个子图像;将当前帧分割得到的子图像按照(B,Hd,Wd,3)的维度排列,进行特征提取,并得到特征图的行人目标框坐标和该框对应的置信度;从目标框中筛选有效框,保留的目标框及其对应的行人类别置信度即可作为行人检测的输出结果;计算当前帧中检测到的所有行人的平均高度Hped,并设定最低和最高阈值Hθ_min和Hθ_max,若Hped<Hθ_min,则将缩放因子z增加1,若Hped>Hθ_max,则将缩放因子z减少1,其它情况则保持缩放因子不变;重复检测下一帧视频,直至整段视频检测完毕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;中新国际联合研究院,未经华南理工大学;中新国际联合研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910095995.7/,转载请声明来源钻瓜专利网。