[发明专利]基于剪枝策略构建卷积神经网络的遥感图像目标检测方法有效
申请号: | 201710852216.4 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107609525B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 王生生;王萌 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 李荣武 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 剪枝 策略 构建 卷积 神经网络 遥感 图像 目标 检测 方法 | ||
本发明公开一种基于剪枝策略构建卷积神经网络的遥感图像目标检测方法,该方法包括以下步骤:步骤一、对目标检测训练数据集进行预处理;步骤二、对初始网络进行预训练,获得稠密网络;步骤三、对步骤二得到的稠密网络,采用基于网络剪枝技术的稠密‑稀疏训练方式,获得训练后稀疏网络,对训练后稀疏网络采用稠密训练方式进行训练,获得精确目标分类网络;步骤四、对步骤三得到的训练后稀疏网络进行处理,并采用稀疏‑稀疏的训练方式,获得快速区域提取网络;步骤五、从目标检测测试数据集生成多尺度图像金字塔,再先后使用快速区域提取网络和精确目标分类网络进行两阶段预测,获得目标的位置和类别标签。
技术领域
本发明涉及自动构建卷积神经网络及遥感图像目标检测。
背景技术
光学遥感传感器空间分辨率在过去十年中有了很大的提高:GeoEye、WorldView和Pleiades系列均具有高空间分辨率;Skysat系列于2013年11月推出,可从太空采集1米地面采样距离(GSD,Ground Sample Distance)的影像。传感器技术的进步为诸如目标检测等图像解译工作提供了机遇与挑战,大量高分辨率图像为深度学习应用于遥感图像目标检测提供了可能,但大规模的数据却导致检测的计算量过高。
依赖于区域提取(Region Proposal)技术的进步以及神经网络的分层提取特征能力的发展,近来大多数基于深度学习的遥感图像目标检测方法都取得了不错的成绩。当前目标检测的解决模式是:首先用区域提取技术从原图中提取候选区域块,然后利用分类器将候选区域块分类。在候选区域块分类阶段使用深度特征作为分类器的输入,一般使用卷积神经网络CNN(Convolutional Neural Network)提取深度特征。区域提取技术大体分为两类,一类是分组方法(Grouping Methods),另一类是窗口打分方法(Windows ScoringMethods)。分组方法首先尝试生成多个图像分割块(可重叠),这些块可能对应于图像中的目标。其次,根据超像素估计、外观线索、边界估计等各种信息对分割后的块进行合并。窗口打分方法则是根据包含感兴趣对象的可能性来对每个候选窗口进行评分,与分组方法相比,这种方法通常只返回边界框,并且速度更快。
当前遥感图像目标检测方法具有一定的局限性:(1)目前在遥感领域使用的区域提取技术有Edge Boxes(窗口打分方法)、Selective Search(分组方法)等使用手工设计(hand-craft)特征,因此不能有效利用数据集自动学习深度特征,导致提取候选区域块时不精确、速度慢。(2)遥感图像具有图像大、目标占比小的特点,在网络的训练阶段,现有的解决模式直接把原图及其标注(ground truth)信息输入网络,从而导致网络学到更多背景信息、较少目标特征信息。基于剪枝策略的网络剪枝技术是神经网络压缩过程中出现的一种技术。网络剪枝技术为自动构建卷积神经网络提供了方法。如图1,网络剪枝技术由三个过程组成:(1)学习网络中重要连接。利用普通训练方式对网络进行训练,但目的是学习网络中重要连接而非只学习权重(2)剪掉网络中权重低于设定阈值的连接,将稠密网络变为稀疏网络;(3)重新训练稀疏网络。不经重新训练而使用稀疏网络将会使网络准确率降低。基于剪枝策略构建出的稀疏卷积神经网络稀疏度高,冗余参数少,比使用普通神经网络速度快,而构建出的稠密卷积神经网络则精确度更高。在遥感图像的区域提取阶段使用卷积神经网络可从数据集自动学习出图像特征,避免手工设计特征不精确的问题。在自动构建网络架构过程中,使用正负比例均衡的区域提取训练数据集和目标分类训练数据集,从而使训练出的网络可平衡学习到背景信息与目标特征信息。
综上所述,我们提出基于剪枝策略构建卷积神经网络的遥感图像目标检测方法。首先,对目标检测训练数据集进行预处理,使得训练集正负比例达到均衡,输出区域提取训练数据集和目标分类训练数据集。然后预训练初始网络,通过稠密-稀疏-稠密的训练方式获得AOCN,通过稠密-稀疏-稀疏的训练方式获得FRPN。最后,从目标检测测试数据集生成多尺度图像金字塔,再先后使用FRPN和AOCN进行两阶段预测,获得目标的位置和类别标签。
发明内容:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710852216.4/2.html,转载请声明来源钻瓜专利网。