[发明专利]一种基于深度学习的边海防目标检测方法有效

专利信息
申请号: 201810159198.6 申请日: 2018-02-26
公开(公告)号: CN108427920B 公开(公告)日: 2021-10-15
发明(设计)人: 刘俊;汪志强;李亚辉;王立林 申请(专利权)人: 杭州电子科技大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 浙江永鼎律师事务所 33233 代理人: 雷仕荣
地址: 310018*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度学习的边海防目标检测方法,提出了一种改进的基于FRCNN的目标检测网络模型,属于目标检测技术以及计算机视觉领域。该方法针对原有的FRCNN算法检测耗时过长的问题,重新设计了检测网络中的特征提取结构,并利用筛选后的图像分类数据集重新训练,得到一个参数量更少、计算量更小的图像分类模型。使用可变形卷积替换原有的特有卷积层,提高检测网络对物体形变的适应能力,从而提高网络结构的平均检出率。
搜索关键词: 一种 基于 深度 学习 海防 目标 检测 方法
【主权项】:
1.一种基于深度学习的边海防目标检测方法,其特征在于,包括以下步骤:步骤(1):重新设计分类网络模型,并用公开的图像分类数据集重新训练;步骤(2):重新构建目标检测网络模型,并利用步骤(1)中得到的分类网络模型作为检测网络特征提取结构的初始化参数进行训练,使用自建的行人车辆数据集进行训练,从而得到目标检测网络模型;步骤(3):选择待检测的图像或者视频,用训练好的目标检测模型进行处理;步骤(4):利用步骤(3)得到的目标检测模型,构建深度学习目标检测平台,其中包括对检测结果的可视化和存储;其中,步骤(1)重新设计分类网络结构,并用公开数据集进行重新训练的步骤为:步骤(1‑1),重新设计分类网络模型,具体包括以下步骤:步骤(1‑1‑1),使用Inception结构扩展标准卷积模块,从输入特征图中提取不同的特征,然后将这些得到的特征进行重新组合生成一个新的特征表示;标准卷积的输出特征图计算公式如下:1≤i,j≤Dk1≤m≤M1≤N其中,F表示一个维度为DF×DF×M的特征图,特征图一般有多个通道,每个通道用一个二维的特征向量表示,DF表示输入特征图的宽度,M表示输入特征图的通道数,DG表示输出特征图的宽度,N是输出特征图的深度,同时也表示卷积核的种类;K表示卷积核参数矩阵,它的维度大小为DK×DK×M×N;对每个输入特征图通道使用深度卷积的操作为:其中,这里的深度卷积核K′的大小变为Dk×Dk×1×M,M表示卷积核的种类;输出特征图G′的第m个通道是由卷积核K′中的第m个滤波器和F'的第m个通道进行卷积操作得到的;步骤(1‑1‑2),通过SE模块对输出的特征图通道进行重新校准;其主要操作如下:(1):压缩操作Fsq,具体为对一个输出通道数为C的特征图Uc,对其中每个二维的特征图通道进行全局池化的操作,得到一组用实数表示的通道描述符向量zc,公式如下:其中,W×H表示U的空间分辨率;(2):增强操作Fex,采用sigmoid来将第一步中获得的一维向量的权值归一化到0~1之间,计算过程如下:s=Fex(z,W)=σ(g(z,W))=σ(W2δ(W1z))其中,z表示由Fsq操作生成的一维向量,g表示sigmoid函数,δ代表ReLU激活函数,W1和W2表示两个全连接层的矩阵权重;(3):缩放操作Fscale,具体计算过程为:Xc=Fscale((Uc,Sc))=Uc×Sc其中,Uc代表第c个通道的特征图,Sc表示第c个通道对应的SE模块输出值;Xc=[x1,x2,...xc]表示缩放之后的相应的通道特征图的联合;步骤(1‑2),对Imagenet数据集进行基于先验知识的筛选,并进行编码处理,具体的方式如下:步骤(1‑2‑1),根据背景和应用需求指定类别编号;步骤(1‑2‑2),根据每个类别对应的文件夹编号将不需要的类别图像从训练集和验证集中移除,留下需要的图像数据,每个文件夹编号代表一类物体;步骤(1‑2‑3),读取原有的训练集标签文件train.txt和验证集标签文件val.txt,将其中无关类别的标签信息从中删除,留下指定的类别并对每一类的文件间进行编号,从而生成新的train.txt和val.txt文件;步骤(1‑2‑4),利用mxnet(深度学习框架)提供的转换工具对图像文件读取并重新编码,从而转换为指定格式的数据库文件;步骤(1‑3),利用设计好的训练网络和筛选后的imagenet图像分类数据集,训练出改进之后的分类网络模型Inception‑Bn‑Dw‑Se网络模型,具体步骤为:步骤(1‑3‑1),参数初始化,对网络中的权重使用均值为0,方差为1的高斯分布进行初始化;步骤(1‑3‑2),图像预处理:从训练样本库中选择无重复的一个批次的图像样本,随机裁剪并进行减均值的操作,将最终得到的矩阵数据送入到深度网络中进行训练;步骤(1‑3‑3),前向传播:将预处理之后的图像样本数据送入分类网络中进行并行的前向传播,即将上面得到的矩阵数据输入到深度卷积神经网络中进行深度可分离卷积、压缩增强操作、池化、全局池化等操作传播到最终的SoftMax层,计算得到最终的分类结果,并与样本对应的真实标签值进行比较,利用网络代价函数得到误差值;步骤(1‑3‑4),反向传播:得到这个批次训练结果的误差之后,将误差值通过梯度的形式反向传播到分类网络中所有含有训练参数的层中,并利用这个梯度来更新网络中可训练的参数;步骤(1‑3‑5),前向传播和反向传播交替迭代作用,直到网络完全收敛或者达到预设的迭代次数,得到最终的训练模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810159198.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top