[发明专利]一种基于深度学习的检测工人是否佩戴安全帽的方法在审
申请号: | 202210363867.8 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114627425A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 曹振华;陈伟烽;梁伟鑫;黄中;周友元;钟振鸿 | 申请(专利权)人: | 珠海路讯科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V20/52;G06V40/10;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 珠海飞拓知识产权代理事务所(普通合伙) 44650 | 代理人: | 陈李青 |
地址: | 519000 广东省珠海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 检测 工人 是否 佩戴 安全帽 方法 | ||
1.一种基于深度学习的检测工人是否佩戴安全帽的方法,其特征在于:所述方法包括以下步骤:
S1、获取足够数量的含有佩戴安全帽人物样本和未佩戴安全帽人物样本的安全帽检测数据集,并随即按一定比例划分为训练集和测试集;
所述获取安全帽检测数据集的方法,包括:
1)对现有的安全帽数据集进行数据清洗,并将标签数据转换为VOC数据集的标注格式;
2)提取现有的行人检测数据集,使用labelimg标注工具对所述行人检测数据进行重新标注,得到可用的安全帽检测数据集;所标注的标签数据为VOC数据集的标注格式;
3)逐帧提取工地监控视频中的图片,对所提取的图片进行筛选并使用labelimg标注工具标注,得到可用的安全帽检测数据集;所标注的标签数据为VOC数据集的标注格式;
所述获取的安全帽检测数据集的标签数据,所标注的位置为图像内人物的头部;所标注的类别分为五类,分别是:佩戴黄色安全帽(yellow)、佩戴红色安全帽(red)、佩戴蓝色安全帽(blue)、佩戴白色安全帽(white)和未佩戴安全帽(none);其中,未佩戴安全帽指的就是没有佩戴安全帽,无论是光头还是受到照明的影响还是带了不是安全帽的帽子都包含在内,神经网络可以在训练过程中自行分辨哪些是佩戴安全帽的,哪些没有佩戴;
S2、使用Pytorch深度学习框架,搭建CSP-R-FCN双阶段目标检测模型,所述CSP-R-FCN双阶段目标检测模型包括骨干网络、csp目标区域推荐模块、R-FCN特征提取模块和R-FCN分类预测模块;
所述骨干网络为在ImageNet数据集上预训练好的VGG16的前四个卷积块,共13层:其中第一层、第二层、第四层、第五层、第七层、第八层、第九层、第十一层、第十二层和第十三层均为卷积层,且卷积核大小均为3*3;第三层、第六层和第十层均为步长为2的最大池化下采样层;
所述csp目标区域推荐模块接在骨干网络之后,可分为三个阶段,依次分别是:残差特征提取阶段、多层特征融合阶段和目标预测阶段;
所述R-FCN特征提取模块的输入为骨干网络的最后一层,经过一个卷积核大小为3*3的卷积层后,分为置信度预测分支和位置预测分支;置信度预测分支和位置预测分支分别经过均值池化层,输出尺寸均为7*7的置信度预测特征图与位置预测特征图;
所述R-FCN分类预测模块,包括:将输入的置信度预测特征图和位置预测特征图通过位置敏感ROI池化(Position-sensitive ROI Pooling)操作,分别得到位置敏感的类别得分图和回归得分图
S3、搭建模型训练和测试系统,对CSP-R-FCN双阶段目标检测模型进行训练和测试,直到其获得检测安全帽佩戴的能力;
S4、提取实际应用场景:工地监控的视频,逐帧进行检测并输出检测结果,完成对安全帽佩戴的检测。
2.根据权利要求1所述的一种基于深度学习的检测工人是否佩戴安全帽的方法,其特征在于:所述步骤S2中,
所述残差特征提取阶段共由9个瓶颈层(BottleNeck Layer)连接而成,并在第一个瓶颈层中做了下采样操作;所述瓶颈层的表达方式为:
所述多层特征融合阶段将三个不同深度的卷积层所提取的特征上采样并做正规化操作后进行拼接,输入分别为上采样2倍的骨干网络最后一层、上采样4倍的残差特征提取阶段第六层和上采样4倍的残差特征提取阶段第九层;
所述目标预测阶段接在多层特征融合阶段之后,经过一个卷积核大小为3*3的卷积层后,输出三个预测分支,分别为中心点(center)、尺寸(scale)和偏置(offset),实现对目标检测区域的推荐;所述的推荐区域为人体的头部;
所述的置信度预测特征图共有49*6=296个,对应6个检测类别(背景、佩戴黄色安全帽、佩戴红色安全帽、佩戴蓝色安全帽、佩戴白色安全帽、未佩戴安全帽),特征图尺寸为7*7;对应检测框的4个位置参数的偏移量(中心点坐标、宽、高),特征图尺寸为7*7。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海路讯科技有限公司,未经珠海路讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210363867.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水煤浆低氮燃烧控制装置
- 下一篇:服务管理方法、装置、存储介质及电子设备