[发明专利]一种实时行人检测方法及神经网络、目标检测层有效
申请号: | 201910095995.7 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109840498B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 胡永健;阿尔法西·萨吉尔·艾哈迈德·萨吉尔;刘琲贝;王宇飞 | 申请(专利权)人: | 华南理工大学;中新国际联合研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 行人 检测 方法 神经网络 目标 | ||
1.一种实时行人检测方法,其特征在于,根据视频中行人的尺寸自动对视频帧进行分割,在单幅视频帧上进行单次迭代,输出行人目标框及行人置信度分数;包括如下步骤:
确定算法中网络接收视频的默认分辨率:Hd×Wd×3,其中Hd、Wd分别指图像的高度和宽度,3指图像包含的色彩通道数;
读取当前帧I,分辨率为H×W×3;
根据缩放因子z的值,决定当前帧I的分割块数B;
根据缩放因子z和分割块数B,调整当前帧I的尺寸为H'×W';
归一化调整尺寸后的帧中各像素值;
分割归一化后的帧为B个子图像;
将当前帧分割得到的子图像按照(B,Hd,Wd,3)的维度排列,进行特征提取,并得到特征图的行人目标框坐标和该框对应的置信度;
从目标框中筛选有效框,保留的目标框及其对应的行人类别置信度即可作为行人检测的输出结果;
计算当前帧中检测到的所有行人的平均高度Hped,并设定最低和最高阈值Hθ_min和Hθ_max,若HpedHθ_min,则将缩放因子z增加1,若HpedHθ_max,则将缩放因子z减少1,其它情况则保持缩放因子不变;重复检测下一帧视频,直至整段视频检测完毕。
2.根据权利要求1所述的实时行人检测方法,其特征在于,所述确定当前帧I的分割块数B的具体方法为:
3.根据权利要求2所述的实时行人检测方法,其特征在于,对于第一帧图像,将缩放因子z初始化为0。
4.根据权利要求1所述的实时行人检测方法,其特征在于,所述根据缩放因子z及分割块数B,调整当前帧I尺寸的方法具体为:
当B=1时,使H′=Hd、W′=Wd;
当B=2时,使H′=Hd、
当B2时,使
5.根据权利要求1所述的实时行人检测方法,其特征在于,所述归一化调整尺寸后的帧是将调整尺寸后的帧中各像素值除以像素取值上限,使其归一化到区间[0,1]。
6.根据权利要求1所述的实时行人检测方法,其特征在于,将归一化后的帧分割成B个子图像,具体包含以下3种情况:
当B=1时,不作分割,整帧输入到网络模型中;
当B=2时,将帧垂直分割成两部分,用x和y分别表示当前帧I中像素的行列坐标,则其中一部分为Il=I(x,y),0≤xWd,0≤yHd,另一部分为Ir=I(x,y),W′-Wd≤xW′,0≤yHd;
当B=z2时,将帧分割为z行z列,共z2个子图像,尺寸均为Hd×Wd。
7.根据权利要求1所述的实时行人检测方法,其特征在于,从候选目标框中筛选有效框具体步骤为:
设置置信度阈值θ和目标框数目上限kbox,在Hout×Wout×9个候选框中仅保留置信度不小于θ的框,且保留数量不超过kbox个,其中,Hout和Wout分别是输出特征图的高度和宽度;所保留的目标框及其对应的行人类别置信度即可作为行人检测的输出结果。
8.根据权利要求1所述的实时行人检测方法,其特征在于,读取当前帧时,若待检测视频帧为单通道图像时,则直接复制该通道信息,构造3通道图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;中新国际联合研究院,未经华南理工大学;中新国际联合研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910095995.7/1.html,转载请声明来源钻瓜专利网。