[发明专利]一种基于多尺度时空传播层的运动目标检测方法有效
申请号: | 202010895232.3 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112036300B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 杨依忠;阮嘉濠;党政;解光军;程心;张章 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/25;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 时空 传播 运动 目标 检测 方法 | ||
本发明公开了一种基于多尺度时空传播层的运动目标检测方法,其步骤如下:1获取具有像素级标签的视频数据集;2构建搭载多尺度时空传播层的网络模型;3训练多尺度时空传播层的网络模型;4利用训练好的模型进行预测,以确认其性能能达到运动目标检测的要求。本发明能为解决现有的运动目标检测对时空特征提取方法的单一、鲁棒性差、只注重局部信息等问题,从而能快速准确检测在不同挑战场景下的前景目标,并加强对前景检测的效果,进而为运动目标检测提供了一种新的解决方法。
技术领域
本发明应用于计算机视觉技术领域,是一种基于多尺度时空传播层的运动目标检测方法。
背景技术
运动目标检测是一种二分类任务,把视频的每一帧图像的每个像素点分为前景或背景。它是视觉应用的基础,在交通分析、拥挤度分析、物体追踪、自动驾驶和异常情况检测等视频监测任务中都起到十分重要的作用。运动目标检测需要克服多种不同噪声对视频的影响,如光线差异、动态背景、物体阴影、相机抖动、物体不规则运动等。目前,运动目标检测算法主要分成两类,一类是对背景进行建模的传统算法,另一类则是利用神经网络自主学习进行前景识别的深度学习算法。
传统算法常对视频背景进行建模以实现运动目标检测。通常会通过利用如颜色、像素点强度、梯度、历史像素点分布等低级特征对背景模型进行更新与维护。然而,由于低级特征易受到噪声影响,因此传统算法只适用于简单场景。另外,传统算法通常依赖人工调优,需要人为的持续干预以保证效果,因此无法具有较好的泛用性。
凭借深度学习对高级特征强大的提取能力与其较少人工干预的特性,基于深度学习的运动目标检测的鲁棒性通常更高,效果更好。且基于深度学习的算法可实现端对端的效果,因此不需要后续的建模过程与后处理。但是,目前基于深度学习的运动目标检测大都依赖神经网络已有的网络层,对时间特征提取手段较为单一,缺乏灵活性。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于多尺度时空传播层的运动目标检测方法,以期能为解决现有的运动目标检测对时空特征提取方法的单一、鲁棒性差、只注重局部信息等问题,从而能快速准确检测在不同挑战场景下的前景目标,并加强对前景检测的效果,进而为运动目标检测提供了一种新的解决方法。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于多尺度时空传播层的运动目标检测方法的特点包括如下步骤:
步骤1、获取视频数据集以及像素级标签;
步骤1.1、选取带有像素级标签的视频图像数据,并分成N段多帧的短视频序列,并对N段多帧的短视频序列中所有像素点进行归一化,得到归一化后的训练样本集,记为S={S1,S2,...,So,...,SN},So表示第o段归一化后的短视频序列,且So={Fo1,Fo2,...,Fon},Fon为第i段归一化后的短视频序列中第n帧图像;o∈[1,N];
步骤2、建立搭载多尺度时空传播层的网络模型,所述网络模型由空间特征提取模块、时空特征融合模块、特征解码模块以及一个类Unet模型组成;
步骤2.1、初始化权重值:对网络模型的卷积层及BatchNormalization层进行参数初始化;
步骤2.2、所述空间特征提取模块由VGG模型的前13层,且每层各连接一个BatchNormalization层所组成;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010895232.3/2.html,转载请声明来源钻瓜专利网。