[发明专利]智能监控环境下基于改进yolov3的实时行人检测方法及装置在审
申请号: | 202011329405.1 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112487911A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 查杭;杨波 | 申请(专利权)人: | 中国信息通信科技集团有限公司;武汉烽火众智数字技术有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 张涛 |
地址: | 430000 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 监控 环境 基于 改进 yolov3 实时 行人 检测 方法 装置 | ||
1.一种智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,包括以下步骤:
获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;
对训练集、测试集和验证集的图像进行预处理;
利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;
通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。
2.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述对训练集、测试集和验证集的图像进行预处理具体包括:
对图像进行水平翻转,颜色、亮度、对比度随机变换,色温变换,随机裁剪的数据扩增操作。
3.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对特征提取网络进行改进具体包括:
采用EfficentNet-B0特征提取网络替换原始yolov3算法的DarkNet53网络。
4.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对特征融合层进行改进具体包括:
将原始yolov3算法的特征融合层卷积系列中的1x1、3x3、1x1、3x3、1x1卷积层减少为1x1、3x3、1x1卷积层。
5.如权利要求4所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对特征融合层进行改进还包括:
将原始yolov3算法的特征融合层的3x3普通卷积改进为压缩卷积。
6.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述对训练集、测试集和验证集的图像进行预处理具体包括:
根据图像的实际长宽比,将原始输入图像的长和宽分别调整到32像素的整数倍,并将网络输入图像尺寸由方形输入调整为固定的矩形输入的形式。
7.如权利要求6所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述在原始yolov3算法的基础上对预测层进行改进具体包括:
改进后的yolov3算法对于矩形图像输入,1/8、1/16、1/32三种尺度预测层中特征图w和h方向的像素数分别为W和H,将三种尺度预测层的输出大小分别改进为WS x HS x 3x(1+4+N)、WM x HM x 3x(1+4+N)、WL x HL x 3x(1+4+N)。
8.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述利用训练集对改进后的yolov3算法进行训练具体包括:
采用不同训练策略及优化参数多次训练,得到多个模型文件。
9.如权利要求1所述的智能监控环境下基于改进yolov3的实时行人检测方法,其特征在于,所述通过测试集和验证集来选取改进后yolov3算法的最优模型具体包括:
在测试集测试单次训练过程中不同训练阶段保存的模型的map指标中,选择map指标最高的模型文件进行保存;
在验证集上测试保存的不同参数下模型的map指标,取map指标最高的模型作为最优模型。
10.一种智能监控环境下基于改进yolov3的实时行人检测装置,其特征在于,包括:
图像标注划分模块,用于获取监控场景下的行人图像,对图像中的行人目标进行标注,将图像按一定比例随机划分为训练集、测试集和验证集;
图像预处理模块,用于对训练集、测试集和验证集的图像进行预处理;
改进yolov3算法训练模块,用于利用训练集对改进后的yolov3算法进行训练,所述改进后的yolov3算法为在原始yolov3算法的基础上对特征提取网络、特征融合层、预测层进行改进后的算法;
模型选取模块,用于通过测试集和验证集来选取改进后yolov3算法的最优模型,并将其用于监控视频下的行人检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国信息通信科技集团有限公司;武汉烽火众智数字技术有限责任公司,未经中国信息通信科技集团有限公司;武汉烽火众智数字技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011329405.1/1.html,转载请声明来源钻瓜专利网。