[发明专利]一种基于单目视觉与深度学习的道路目标检测识别方法在审
申请号: | 201811547843.8 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109766769A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 吴志红;张泽轩 | 申请(专利权)人: | 四川大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 包晓静 |
地址: | 610064 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 道路车辆检测 卷积神经网络 单目视觉 道路目标 二段式 检测 检测器 基准检测器 准确度 车辆检测 车辆特征 光线变化 检测结果 静态图像 实验条件 图像特征 网络模型 训练阶段 语义表达 包围框 健壮性 特征图 置信度 预测 截断 层级 卷积 学习 遮挡 阴影 削减 分类 共享 应用 | ||
1.一种基于单目视觉与深度学习的道路目标检测识别方法,其特征在于,所述基于单目视觉与深度学习的道路目标检测识别方法包括以下步骤:
第一步,建立小样本道路车辆数据集,收集真实场景下的道路车辆图像;
第二步,将深度卷积神经网络框架SSD应用于道路车辆检测,结合VGG形成新的网络结构,实现端到端的实时检测,训练阶段使用带动量的梯度下降法学习网络的权值参数,将交叉熵损失函数和平滑的L1损失函数作为分类器及位置回归的损失函数;
第三步,通过二次迁移学习在VOC数据集和小样本道路车辆数据集上微调网络较高层的权值参数;
第四步,引入带横向连接的特征图金字塔,以跳跃传递的方式附着于原始网络,不改变原来的网络结构,增加少量的权值参数和计算操作;
第五步,采用平衡的焦点损失函数来衡量目标的分类准确度,减少训练过程中大量小车样本对网络权值学习的贡献率,促使训练更专注于难例样本。
2.如权利要求1所述基于单目视觉与深度学习的道路目标检测识别方法,其特征在于,所述第一步中着重筛选公开数据集中三轮车、货车,标注对应的车辆标签。
3.如权利要求1所述基于单目视觉与深度学习的道路目标检测识别方法,其特征在于,所述第一步具体包括:
(1)通过图像录制设备获取一定量的真实道路场景视频数据,其中包含大量各类机动车非机动车以及行人的图像信息;
(2)编写程序以时间间隔将视频中的清晰帧保存为带有格式的图像,在所有图像上进行人工标注,将所有图像上的所有车辆以及行人标记出来并将位置信息保存为对应的图像标签;同时编写程序对VOC数据集进行筛选,得到包含各类交通工具以及行人的数据集部分。
4.如权利要求1所述基于单目视觉与深度学习的道路目标检测识别方法,其特征在于,所述第二步中具体模型为基于SSD目标检测模型结构,对其中的特征提取网络VGG进行了替换修改优化,在通道维度等分每一个中间特征图得到matrix1和matrix2,并使用以下操作保留两个特征矩阵对应点的最大值从而得到新的maxout特征矩阵matrix3:matrix3=matrix1-matrix2,截断matrix3的最小值使其等于0,接着matrix3=matrix3+matrix2;
训练阶段使用带动量的梯度下降法学习网络的权值参数,将交叉熵损失函数:和平滑的L1损失函数:分别作为目标类别分类及目标检测框位置回归的损失函数。
5.如权利要求1所述基于单目视觉与深度学习的道路目标检测识别方法,其特征在于,所述第五步中采用平衡的焦点损失函数FocalLoss:
代替交叉熵损失函数来衡量目标的分类准确度,减少训练过程中大量小车样本对网络权值学习的贡献率,促使训练更专注于难例样本。
6.一种应用权利要求1~5任意一项所述基于单目视觉与深度学习的道路目标检测识别方法的智能交通管理平台。
7.一种应用权利要求1~5任意一项所述基于单目视觉与深度学习的道路目标检测识别方法的智慧城市管理平台。
8.一种应用权利要求1~5任意一项所述基于单目视觉与深度学习的道路目标检测识别方法的车联网控制平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811547843.8/1.html,转载请声明来源钻瓜专利网。