[发明专利]一种基于深度卷积神经网络的视频小目标检测方法在审

申请号：	201811017919.6	申请日：	2018-09-03
公开（公告）号：	CN109376736A	公开（公告）日：	2019-02-22
发明（设计）人：	王慧燕	申请（专利权）人：	浙江工商大学
主分类号：	G06K9/32	分类号：	G06K9/32;G06N3/04;G06N3/08
代理公司：	浙江杭州金通专利事务所有限公司 33100	代理人：	许可唯
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于深度卷积神经网络的视频小目标检测方法，利用深度卷积神经网络多层非线性结构的特性对视频目标特征进行整体建模，结合Faster RCNN对于普通视频目标检测快速准确的特点以及ResNet在深度网络特征提取层加入的effective path（多人投票系统），再加上后期对网络结构的精简，提出了一种可以对视频目标进行快速检测，同时兼顾小目标检测的基于深度网络结构ERF‑Net（Efficient Residual Faster rcnn）的视频目标检测方法。本发明的优点如下：对视频中不同远近、不同尺度大小的目标进行准确、快速检测，提高了小目标检测的效果和效率，为后续的目标跟踪、目标再识别等提供了较好的基础。
搜索关键词：	视频目标小目标检测卷积神经网络视频快速检测网络结构非线性结构目标跟踪投票系统网络特征整体建模提取层多层尺度
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度卷积神经网络的视频小目标检测方法，其特征在于包括如下步骤：步骤（1）模型预训练：基于预训练的VGG模型开始网络的迭代训练，在大小为51×39的256通道图像的每一个位置取9个候选窗口，即三种面积{1282,2562,5122}×三种比例{1:1,1:2,2:1}，候选窗口作为anchors,即锚点；步骤（2）基于深度卷积神经网络的特征提取：加入残差结构的卷积层用于提取特征图，网络使用的损失函数为；其中，i表示锚点索引值，pi表示前景的softmax预测概率，表示对应的Ground Truth预测概率，t表示预测的bounding box，t*表示前景锚点对应的Ground Truth box，且，，为参数；步骤（3）获取候选区域及其对应的Softmax概率：依据步骤（1）、（2）中训练得到的网络E‑RPN，获取候选ROI区域，获取检测目标的Softmax概率；步骤（4）读取候选区域及其对应的Softmax概率：将获取的候选ROI区域信息传入网络，将其对应的Softmax概率作为bbox_inside_weights传入网络，通过caffe blob大小对比，计算得出bbox_outside_weights作为参数；步骤（5）循环迭代训练E‑RPN网络：将获取得到的候选ROI区域循环迭代训练网络E‑RPN，直至Softmax概率与检测框回归，得到最终模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工商大学，未经浙江工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811017919.6/，转载请声明来源钻瓜专利网。

上一篇：身份信息提取方法、装置、电子设备与存储介质
下一篇：一种协助用户解决学习问题的方法和系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度卷积神经网络的视频小目标检测方法在审

专利文献下载