[发明专利]一种融合图像预处理与深度学习目标检测的人头检测方法在审
申请号: | 202010116670.5 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111339934A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 李好洋;黄家名;秦瑜恒;周小芹 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06N3/08;G06N3/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 张倩倩 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 图像 预处理 深度 学习 目标 检测 人头 方法 | ||
1.一种人头检测方法,其特征是,包括:
实时获取监控图像数据;
对获取到的监控图像数据进行预处理;
将预处理后的监控图像数据输入至预先训练的神经网络,得到监控图像数据中的待选区域anchor及其对应的偏移值与置信度;所述神经网络为深度学习神经网络,其训练样本为根据图像数据中待选区域anchor与人头标定区域ground-truth的交并比选择出anchor正负样本,且正样本具有偏移标签和置信度标签,负样本具有置信度标签的图像数据集;
根据神经网络输出的anchor的置信度,选择存在目标的anchor;
根据神经网络输出的anchor的偏移值,计算对应相应目标的预测边界框的位置和大小;
将预测边界框按照其位置和大小在监控图像数据中画出,即得到结果图像;
输出结果图像以及图像中检测到的人头数量,所述人头数量即为图像中预测边界框的数量。
2.根据权利要求1所述的方法,其特征是,神经网络的训练步骤包括:
采集多个历史监控图像,组成图像数据集;
对图像数据集中的各监控图像进行标注,标注出图像中所有人头的位置信息作为人头标定区域ground-truth;
确定神经网络所使用的anchor的大小;
对于各监控图像,分别选择用于训练的anchor正负样本;
对于各选出的正负样本,分别生成训练所需的标签,正样本标签包括偏移值标签和置信度标签,负样本标签包括置信度标签;
搭建神经网络模型,配置神经网络模型参数,使用Adam优化器,设计损失函数;
将监控图像数据输入神经网络,利用图像对应的偏移值标签和置信度标签计算损失函数,使用优化器对损失函数的参数进行反向传播,优化模型参数。
3.根据权利要求1或2所述的方法,其特征是,神经网络的神经网络层采用卷积层,池化层由步长为2的卷积核代替,利用上采样和融合机制,最终生成两个大小不同的特征图用于目标检测。
4.根据权利要求3所述的方法,其特征是,anchor的大小计算公式为:
anchor_size=layer_stride*aspect_ratio*anchor_scale
其中,layer_stride为下采样的倍数,aspect_ratio为anchor的宽高比,anchor_scale为anchor在特征图上的尺度scale。
5.根据权利要求4所述的方法,其特征是,对于40*30的大特征图,下采样倍数layer_stride为16,aspect_ratio设为1,anchor_scale设置为2和4;对于10*8的小特征图,layer_stride为64,aspect_ratio为1,anchor_scale为2和4。
6.根据权利要求2所述的方法,其特征是,所述选择用于训练的anchor正负样本为:
将ground-truth与anchor的交并比大于等于0.7的anchor,或ground-truth与anchor具有最大交并比的anchor标记为正样本;
将ground-truth与anchor的交并比小于等0.3的anchor标记为负样本;
正负样本数量的比例为1:1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010116670.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像匹配方法、装置、设备及存储介质
- 下一篇:图像噪声点的判断方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序