[发明专利]一种适于隧道视角受限的目标深度学习视频检测方法在审
申请号: | 202110332618.8 | 申请日: | 2021-03-29 |
公开(公告)号: | CN115131742A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 阮雅端;王麟皇;孟凡泽;王翔;汪婧文;陈启美 | 申请(专利权)人: | 南京大学 |
主分类号: | G06V20/54 | 分类号: | G06V20/54;G06V20/52;G06V10/32;G06V10/44;G06V10/762;G06V10/764;G06V10/82;G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 奚铭 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适于 隧道 视角 受限 目标 深度 学习 视频 检测 方法 | ||
一种适于隧道视角受限的目标深度学习视频检测方法,包括以下步骤:step1:构建带有标注和标签的图片库作为网络模型的训练样本集;step2:构建网络模型:以SSD网络为基础构建检测网络,使用融入Mish激活函数和BN层的VGG‑16作为检测网络的backbone,使用跃层双向多尺寸特征融合作为检测网络的neck,检测网络的head使用SSD网络的head;step3:训练网络模型,训练过程中采用基于目标尺寸大小的自适应在线难分样本发掘,训练获得检测模型;step4:输入测试样本,通过训练好的检测模型预测出隧道图像中的目标位置及类别。本发明适用于隧道等视角受限、检测目标极小、存在环境干扰等场合的目标检测,具有良好的检测性能。
技术领域
本发明属于智能视频检测技术领域,涉及对视频中目标的识别与定位,为一种适于隧道视角受限的目标深度学习视频检测方法。
背景技术
隧道以其优越的特性,过江、穿山、越湖,避免地面建筑等优势而急速发展。然而隧道的密闭性,使得一旦发生交通事故,很容易引起二次事故等严重的后果。隧道内事故危险系数高,仅依靠工作人员人工监测隧道内的车辆运行状况已无法满足日益增加的交通压力,基于视频分析的隧道态势监测与异常事件预警已成为新趋势。虽然基于人工智能的深度学习视频检测方法已在交通领域得以广泛地应用,但隧道内摄像头普遍以倾斜角度设置于4.5米高度处,对于远处的车辆,在视频中存在体积较小、特征难以提取等特点;同时隧道内场景复杂,如车灯眩光干扰严重、车辆密集时遮挡严重等,均使得现有的视频目标检测方法难以实时、准确地检测出车辆目标,严重制约着隧道智能监控系统的发展。
发明内容
本发明要解决的问题是:隧道摄像限高、视角受限,导致视频画面中较远处车辆目标极小,这些目标在1920*1080分辨率的画面中只有约40*30的像素大小,约占整个画面的0.058%。小目标的提取成为针对隧道场景的视频检测深度学习方法难以应用的症结,此外,隧道场景的视频目标检测还存在眩光干扰,遮挡严重等环境因素影响。
本发明的技术方案为:一种适于隧道视角受限的目标深度学习视频检测方法,包括以下步骤:
step1:构建训练数据集:采集隧道内高清摄像头的视频图像,构建带有标注和标签的图片库作为网络模型的训练样本集,标注及标签即目标的目标框;
step2:构建网络模型:以SSD网络为基础构建检测网络,使用融入Mish激活函数和BN层的VGG-16作为检测网络的backbone,使用跃层双向多尺寸特征融合作为检测网络的neck,检测网络的head使用SSD网络的head;
step3:利用step1中的训练集训练step2中的网络模型,训练过程中采用基于目标尺寸大小的自适应在线难分样本发掘,训练获得检测模型;
step4:输入测试样本,通过训练好的检测模型预测出隧道图像中的目标位置及类别。
本发明适用于隧道环境视角受限所造成的小运动目标的提取,对隧道内车辆、行人、非机动车等目标进行识别与定位,该检测结果可作为基础检测模块,后续可对检测结果调用从而获取交通态势参数及异常事件预警信息。
本发明与现有技术相比,具有以下优点:
第一、本发明的检测方法可以检测出隧道场景下约占整个视频画面面积0.058%的极小目标。在隧道场景下,与本发明采用同一backbone的现有SSD算法的检测准确率为93.2%,检出率仅有36.24%,无法检测出大部分的小目标,本发明的检测准确率为98.89%,检出率为95.21%,可以检测出绝大部分小目标,使得检出率有了极大提升;
第二、本发明网络推理速度快,满足实时性要求。目前常用视频检测算法FasterR-CNN、Cascade R-CNN的检测准确率均为95%以上,但推理速度分别为13FPS和5FPS,无法满足实时性要求。本发明在检测准确率为98.89%,检出率为95.21%的条件下,推理速度达到30FPS,满足实时性要求;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332618.8/2.html,转载请声明来源钻瓜专利网。