[发明专利]基于深度全卷积神经网络的运动目标检测方法有效
申请号: | 201810193049.1 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108492319B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 白静;陈盼;徐航;焦李成;李晓宇;李超贤;李笑寒;缑水平 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04;G06N3/08;G06T7/136;G06T7/215 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于深度全卷积神经网络的运动目标检测方法,用于解决现有有监督运动目标检测方法中存在的检测精度低和检测复杂度高的技术问题,实现步骤为:(1)提取视频场景的背景图像;(2)获取多通道视频帧序列;(3)构建训练样本集与测试样本集,并对该两个样本集进行归一化;(4)构建深度全卷积神经网络模型;(5)对深度全卷积神经网络模型进行训练;(6)用训练好的深度全卷积神经网络模型对测试样本集进行预测;(7)获取运动目标检测结果。本发明通过深度全卷积神经网络模型实现运动目标检测,提高了运动目标检测的精度,并降低了检测的复杂度,可用于监控视频的目标识别、目标追踪与动作识别等领域。 | ||
搜索关键词: | 基于 深度 卷积 神经网络 运动 目标 检测 方法 | ||
【主权项】:
1.一种基于深度全卷积神经网络的运动目标检测方法,其特征在于,包括如下步骤:(1)提取视频场景的背景图像:(1a)选取N个带有人工标注的Ground truth图像的视频场景,N≥10;(1b)计算每个视频场景中前M帧图像的平均图像,并将每个视频场景的平均图像作为该视频场景的背景图像,得到N个背景图像,其中,100≤M≤200;(2)获取多通道视频帧图像序列:(2a)将N个场景的视频帧图像序列、视频帧图像序列中每个图像对应的Ground truth图像以及各场景的背景图像缩放至同一尺寸,缩放后的图像的宽和高不少于320像素;(2b)将缩放后的视频帧图像序列中的每一个图像与其对应场景的背景图像分别进行通道合并,得到多通道视频帧图像序列;(3)构建训练样本集和测试样本集,并对该两个样本集进行归一化:(3a)从多通道视频帧图像序列中随机选取30%以上的图像序列和图像序列中每个图像对应的Ground truth图像作为训练样本集,并将剩余的图像序列和剩余图像序列中每个图像对应的Ground truth图像作为测试样本集;(3b)对训练样本集与测试样本集进行归一化,得到归一化的训练样本集和测试样本集;(4)构建深度全卷积神经网络模型:构建包含44层的深度全卷积神经网络模型:输入层→预卷积层→第一卷积层1→第一卷积层2→第一池化层→第二卷积层1→第二卷积层2→第二池化层→第三卷积层1→第三卷积层2→第三卷积层3→第三池化层→第四卷积层1→第四卷积层2→第四卷积层3→第四池化层→第五卷积层1→第五卷积层2→第五卷积层3→第五池化层→第六卷积层1→第六卷积层2→第六卷积层3→第一反卷积层→第七卷积层1→第七卷积层2→第七卷积层3→第二反卷积层→第八卷积层1→第八卷积层2→第八卷积层3→第三反卷积层→第九卷积层1→第九卷积层2→第九卷积层3→第四反卷积层→第十卷积层1→第十卷积层2→第五反卷积层→第一后卷积层→第一Dropout层→第二后卷积层→第二Dropout层→输出层;(5)对深度全卷积神经网络模型进行训练:将归一化的训练样本集作为深度全卷积神经网络模型的输入,并将训练样本集所对应的Ground truth作为训练样本集的标签,对深度全卷积神经网络模型进行K次迭代监督训练,得到训练好的深度全卷积神经网络模型,其中,K≥30000;(6)用训练好的深度全卷积神经网络模型对测试样本集进行预测:将测试样本集输入到训练好的深度全卷积神经网络模型中,得到该测试样本集的语义分割图像序列;(7)获取运动目标检测结果:(7a)对语义分割图像序列进行3×3的均值滤波,得到滤波后的图像序列;(7b)对滤波后的图像序列进行阈值分割:将滤波后的图像序列中图像像素值小于0.5的像素值设置成0,图像像素值大于或者等于0.5的像素值设置成255,得到阈值分割后的图像序列;(7c)对阈值分割后的图像序列中的每个图像进行缩放:将阈值分割后的图像序列中的每个图像缩放成与原始视频帧图像大小相同的图像,得到缩放后的图像序列;(7d)对缩放后的图像序列中的每个图像进行阈值分割:将缩放后的图像序列中的每个图像中像素值小于10的像素值设置成0,像素值大于或者等于10的像素值设置成255,得到最终的运动目标检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810193049.1/,转载请声明来源钻瓜专利网。