[发明专利]一种基于卷积神经网络的快速车辆检测方法在审
申请号: | 201910782686.7 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110490156A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 马静;张苏元;吴顺义 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙江省哈*** | 国省代码: | 黑龙;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 卷积神经网络 训练数据集 车辆检测 预处理 摄像机采集 车辆目标 道路图像 基础网络 快速车辆 视频输入 实时性 图像 制作 | ||
1.一种基于卷积神经网络的快速车辆检测方法,其特征在于包括以下步骤:
步骤(1)获取基础图像数据并进行样本预处理,得到训练数据集;
步骤(2)搭建卷积神经网络架构、SSD网络和VGG16网络;
步骤(3)将训练数据输入搭建好的网络进行训练,得到训练模型;
步骤(4)利用训练好的模型进行视频车辆检测。
2.如权利要求1所述的车辆检测方法,其特征在于:步骤(1)具体为:在车辆前方安装摄像头,在车辆行驶过程中,拍摄若干前方道路的视频,将这些视频每隔10帧保存为图片,并对每一张图片中的车辆进行标注,构建训练数据集。
3.如权利要求1所述的车辆检测方法,其特征在于:步骤(2)具体为:对VGG16网络进行修改,将两个全连接层替换为卷积层,并在之后接入多个卷积层;
然后利用处理后的SSD网络计算目标的位置,类别和置信度,其中目标的位置指的是目标物体框在图片中的位置,主要有四个参数x,y,w,h,分别表示目标物体框的左上角坐标,以及物体框的高度和宽度;根据标注信息设置不同提取框的特征层的宽高比;
设置总体的损失函数,包括分类损失函数与回归损失函数,称为联合损失函数,定义为:
式中N是待预测anchor的个数,x,c,l,g,分别表示属于,预测框,真实框,预测框与真实框匹配的标记以及某个类别的概率,α是权重调节参数。
4.如权利要求1所述的车辆检测方法,其特征在于:步骤(3)具体为:用K个随机取值的卷积核对图像进行卷积,得到K个特征图;
分别获取SSD模型中的Fc7层,Conv8_2层,Conv9_2层,Conv10_2层,Conv11_2层的特征图信息,使用全局平均池化进行降维再接入并行的分类和边框回归层进行筛选并输出预测框的位置和目标检测类别;同时基于再训练的SSD模型的参数进行特征提取,通过多轮多次迭代以及参数调整获取优化模型。
5.如权利要求1所述的车辆检测方法,其特征在于:步骤(4)具体为:将任意待测的视频输入到训练好的模型中;对于输入视频的每帧图像,模型随机选取多个区域,并对区域进行打分;
设定一个阈值δ=0.2,将选取的每个区域的得分与阈值δ对比,得分高于δ的区域,则判定为包含车辆并进行标注;得分低于δ的区域,则判定为不包含车辆或包含不完整车辆,直到所有区域标注完毕;当所有帧图像处理完成后,得到相应的输出视频,视频中将标注出所有车辆;完成一段视频中对所有车辆的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910782686.7/1.html,转载请声明来源钻瓜专利网。