[发明专利]一种视频流中的车辆检测方法有效
申请号: | 201910157557.9 | 申请日: | 2019-03-01 |
公开(公告)号: | CN109829445B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 郭烈;何丹妮;郑仁成;姚宝珍;李琳辉;孙大川 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 中的 车辆 检测 方法 | ||
本发明公开了一种视频流中的车辆检测方法,包括以下步骤:获取视频帧,采用训练完成的卷积神经网络对获得的视频帧进行识别,并根据结果判断视频中是否有车辆,以及车辆所在的具体位置;由车辆检测得到车辆在图像中的位置,用卡尔曼滤波器预测其在下一帧的数值,作为车辆跟踪结果;将车辆检测的结果和车辆跟踪的结果进行关联,依据关联结果修正滤波器参数,更新滤波器群信息。本发明设计一种网络层数少、结构小的卷积神经网络用于车辆检测任务,检测速度快、精度高。本发明使用卡尔曼跟踪算法进行检测框的位置预测,跟踪速度快且稳定。本发明利用数据关联策略将检测算法与跟踪算法结合,体现帧与帧之间车辆的关联性,并且能降低车辆对象的漏检率。
技术领域
本发明涉及一种基于计算机视觉的车辆检测算法,特别是一种视频流中的车辆检测方法。
背景技术
车辆检测(objection detection)是指利用计算机视觉算法找出图像中所有感兴趣的车辆,确定它们的位置及类别。广泛应用于视频监控、无人驾驶、人机交互等领域。
目前已知的视频流中的车辆检测方法主要分为两类,一类是将视频流拆分成每一帧图像,再对每一帧图像检测其中的车辆。这样做的弊端在于计算量大、效率低,且没有体现出帧与帧之间车辆的关联性,导致产品智能化水平较低。
另一类是在第一帧中检测出车辆,之后的若干帧利用车辆跟踪算法进行跟踪。这样做的弊端在于无法检测出新出现的车辆,而且若车辆所处环境光照变化大,如进出隧道时,很容易发生跟踪丢失的现象。
发明内容
为解决现有技术存在的上述问题,本发明要提供一种既能够减少计算量并提高检测效率,又能体现视频流中车辆的关联性进而提高产品智能化水平的视频流中的车辆检测方法。
为了实现上述目的,本发明的技术方案如下:一种视频流中的车辆检测方法,包括以下步骤:
A、车辆检测
获取视频帧,采用训练完成的卷积神经网络对获得的视频帧进行识别,并根据结果判断视频中是否有车辆,以及车辆所在的具体位置。具体包括以下步骤:
A1、获取待检测车辆样本数据集;收集包含车辆的若干张图像,图像包含各种场景下,待检测车辆的可能的状态。对于长宽不等的图像,先将图像用0像素填充到长宽相等,再放缩到416×416像素大小。在labelImage软件中用矩形框标注每张图像中的车辆信息,保存标注信息文档。
A2、搭建卷积神经网络用作特征提取;采用的特征提取网络结构依次为:卷积层1、最大池化层1、卷积层2、最大池化层2、卷积层3、最大池化层3、卷积层4、最大池化层4、卷积层5、最大池化层5、卷积层6、最大池化层6、卷积层7、卷积层8、卷积层9、卷积层10。
A3、按照步骤A2所描述的网络结构,特征提取网络最终输出向量为13×13×255,因此连接一个yolo层,使其输出向量为13×13×5×(1+5),最终完整的网络结构及每层的参数如下:
输入图片大小为416*416*3,3代表图片为彩色图片有三个通道,经过卷积层1,使用16个大小为3*3的卷积核,步长为1,经过这一层数据的输出大小变为416*416*16;
通过核大小为2*2,步长为2的最大池化层1,得到208*208*26的数据;
卷积层2中有32个大小为3*3的卷积核,卷积步长为1,得到数据大小为208*208*32;
再通过核大小为2*2,步长为2的最大池化层2,得到104*104*32的数据;
卷积层3中有64个大小为3*3的卷积核,卷积步长为1,得到数据大小为104*104*64;
再通过核大小为2*2,步长为2的最大池化层3,得到52*52*64的数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910157557.9/2.html,转载请声明来源钻瓜专利网。