[发明专利]一种实时行人检测方法及神经网络、目标检测层有效

申请号：	201910095995.7	申请日：	2019-01-31
公开（公告）号：	CN109840498B	公开（公告）日：	2020-12-15
发明（设计）人：	胡永健;阿尔法西·萨吉尔·艾哈迈德·萨吉尔;刘琲贝;王宇飞	申请（专利权）人：	华南理工大学;中新国际联合研究院
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06K9/62
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	刘巧霞
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种实时行人检测方法，该方法的步骤主要包括：确定默认分辨率，读取视频帧，根据缩放因子确定分割块数，调整视频帧尺寸，分割视频帧，将分割后视频帧子块叠放并提取特征，预测候选行人框的坐标参数以及行人置信度分数，筛选出最终的行人框结果，根据当前帧行人尺寸调整缩放因子，继续处理下一帧直至完成全部检测任务。本发明公开了一种神经网络，包括7或8或9层卷积层。本发明还公开了一种目标检测层，该目标检测层实现行人目标框坐标预测和目标框置信度预测两部分功能。本发明通过缩放因子对视频帧进行自适应缩放，在保证检测精度及运算速度的情况下，尤其提高了对小尺寸行人目标的检测效果。
搜索关键词：	一种实时行人检测方法神经网络目标
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种实时行人检测方法，其特征在于，根据视频中行人的尺寸自动对视频帧进行分割，在单幅视频帧上进行单次迭代，输出行人目标框及行人置信度分数；包括如下步骤：确定算法中网络接收视频的默认分辨率：H_d×W_d×3，其中H_d、W_d分别指图像的高度和宽度，3指图像包含的色彩通道数；读取当前帧I，分辨率为H×W×3；根据缩放因子z的值，决定当前帧I的分割块数B；根据缩放因子z和分割块数B，调整当前帧I的尺寸为H′×W′；归一化调整尺寸后的帧中个像素值；分割归一化后的帧为B个子图像；将当前帧分割得到的子图像按照(B，H_d，W_d，3)的维度排列，进行特征提取，并得到特征图的行人目标框坐标和该框对应的置信度；从目标框中筛选有效框，保留的目标框及其对应的行人类别置信度即可作为行人检测的输出结果；计算当前帧中检测到的所有行人的平均高度H_ped，并设定最低和最高阈值H_{θ_min}和H_{θ_max}，若H_ped＜H_{θ_min}，则将缩放因子z增加1，若H_ped>H_{θ_max}，则将缩放因子z减少1，其它情况则保持缩放因子不变；重复检测下一帧视频，直至整段视频检测完毕。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学;中新国际联合研究院，未经华南理工大学;中新国际联合研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910095995.7/，转载请声明来源钻瓜专利网。

上一篇：一种基于深度学习的指针式水表读数检测方法
下一篇：一种快速检测印刷品打印及装订质量的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种实时行人检测方法及神经网络、目标检测层有效

专利文献下载