[发明专利]一种基于单目视觉与深度学习的道路目标检测识别方法在审
申请号: | 201811547843.8 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109766769A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 吴志红;张泽轩 | 申请(专利权)人: | 四川大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 包晓静 |
地址: | 610064 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 道路车辆检测 卷积神经网络 单目视觉 道路目标 二段式 检测 检测器 基准检测器 准确度 车辆检测 车辆特征 光线变化 检测结果 静态图像 实验条件 图像特征 网络模型 训练阶段 语义表达 包围框 健壮性 特征图 置信度 预测 截断 层级 卷积 学习 遮挡 阴影 削减 分类 共享 应用 | ||
本发明属于道路车辆检测技术领域,公开了一种基于单目视觉与深度学习的道路目标检测识别方法;将深度卷积神经网络应用于车辆检测,全面丰富地学习静态图像中车辆特征,实现了基于图像特征的准确快速的道路车辆检测,对遮挡、截断、光线变化、阴影等常见的干扰情况均有较强的健壮性,摒弃了二段式卷积神经网络检测器中繁琐的区域推荐步骤,通过卷积实验确定可能的包围框的位置和大小,且各分类在训练阶段共享置信度,大大削减了参数数量。本发明在预测阶段结合不同层级的多个特征图进行预测,增加网络模型的语义表达能力,最终检测结果的准确度和速度均优于同样实验条件下二段式基准检测器Faster R‑CNN的检测效果。
技术领域
本发明属于道路车辆检测技术领域,尤其涉及一种基于单目视觉与深度学习的道路目标检测识别方法。
背景技术
真实道路摄像头下交通状况复杂,车流密集,各种车型分布不均衡造成车辆样本类间失衡,与公开数据集中车辆状况差异甚大,且极少存在三轮车样本。这造成模型训练时不能均衡学习不同种类车辆的特征,在实际应用中会发生某些类别的车辆检测效果好,而另一些类别的车辆检测效果差的问题。另外如果没有某类车辆的样本,也就无法训练得到能够检测该类车辆的模型。
上述技术问题为客观存在的事实,大量便于获得的场景图像数据在训练角度来看不够完善,需要大量的工作来人工或半人工完善用于训练的数据集,同时采用创新的训练方法来训练检测模型,使得模型对于各类目标具有同等且广泛的识别力。解决上述的技术难题,对于提升模型对于真实世界中复杂道路目标的检测率与召回率,同时大大增加模型的可用性具有决定性的重要意义。
发明内容
针对现有技术存在的问题,本发明提供了一种基于单目视觉与深度学习的道路目标检测识别方法,将深度卷积神经网络应用于车辆检测,全面丰富地学习静态图像中车辆特征,实现了基于图像特征的准确快速的道路车辆检测,对遮挡、截断、光线变化、阴影等常见的干扰情况均有较强的健壮性,并针对性地在数据库中完善三轮车样本数据,以得到可检测出三轮车的模型。
本发明是这样实现的,一种基于单目视觉与深度学习的道路目标检测识别方法,所述基于单目视觉与深度学习的道路目标检测识别方法包括以下步骤:
第一步,建立小样本道路车辆数据集,收集真实场景下的道路车辆图像;
第二步,将深度卷积神经网络框架SSD应用于道路车辆检测,结合VGG形成新的网络结构,实现端到端的实时检测,训练阶段使用带动量的梯度下降法学习网络的权值参数,将交叉熵损失函数和平滑的L1损失函数作为分类器及位置回归的损失函数;
第三步,通过二次迁移学习在VOC数据集和小样本道路车辆数据集上微调网络较高层的权值参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811547843.8/2.html,转载请声明来源钻瓜专利网。