[发明专利]基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法有效
申请号: | 201811544066.1 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109784347B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 李映;房蓓;张号逵 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/774;G06V10/764;G06K9/62;G06N3/04 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法,通过使用稠密连接机制构建多尺度稠密卷积神经网络,稠密链接机制能够有效的缓解梯度消失问题,加强了特征传播,鼓励特征复用以及极大地减少了参数数量,降低了网络训练过程中对训练样本的需求;此外网络并结合谱注意力机制,对谱方向的特征利用更加有效。本发明实现了小样本条件下,高光谱图像深度特征的自主提取,高精度的分类。本发明与现有的基于深度学习的高光谱图像分类方法相比,样本需求量更小,精度更高。 | ||
搜索关键词: | 基于 尺度 稠密 卷积 神经网络 注意力 机制 图像 分类 方法 | ||
【主权项】:
1.一种基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法,其特征在于步骤如下:步骤1:数据预处理对待处理的高光谱图像数据进行最大最小归一化,归一化公式如下:
其中xijs表示高光谱图像中的一个像元,i、j分别表示该像元位于高光谱图像中的坐标位置,s表示高光谱图像的谱段,
为归一化后的一个像元,x··smax、x··smin分别表示三维高光谱图像在s谱段的最大值和最小值;步骤2:数据分割统计待处理的高光谱图像中,各个类别标注样本的个数,然后按照比例,从每个类别中,抽取5个标注的样本作为训练数据,剩余的部分作为测试数据;具体做法如下,对于一个尺寸为M×N×D的三维高光谱图像数据,M,N分别表示高光谱图像的高和宽,D表示数据的波段数;抽取样本时,以待处理像素为中心,抽取S×S×D的数据块作为中心像素的样本数据,S表示邻域大小;步骤3:构建网络模型首先深度网络使用稠密连接机制用于导出网络中的多级特征,使用三维扩张卷积,可以使用多尺度特征图生成光谱空间特征;此外,在每层网络中增加谱注意力机制策略;所述的稠密连接机制:第l层的输出是由前面所有层x0,...,xl‑1的特征图连接组成的,表示为xl=F({x0,...,xl‑1}),F(·)表示非线性变换;对于本网络结构使用的多尺度三维扩张卷积,第i层的第j个通道的三维扩张卷积的扩张值设置为sij=((iw+j)mod 10)+1,w表示每层卷积层的卷积个数;所述的谱注意力机制:数据块U大小为S×S×D,从谱的方向上数据块U可以表示为Fspectral,经过谱注意力机制生成的向量为g,大小为1×1×D,得到Fsacle为加入谱注意力机制后的向量,最后生成为U’,大小为S×S×D;将谱注意力机制加入到多尺度稠密网络中,右侧网络结构为注意力机制网络结构图,在三维扩张卷积操作之后但在连接操作之前作为权重加入;步骤4:训练网络模型将训练数据批量的输入到构建好的深度网络中,以标注的类别为指导信号,利用梯度下降算法对网络参数进行训练,直至网络收敛;训练过程中,每次随机不重复的从训练集里抽取10‑20样本为一批训练数据,将该数据输入到网络,抽取特征并计算预测结果,以预测结果与实际结果之间的交叉熵为损失函数,计算网络权值的偏导数,并利用梯度下降算法,更新网络参数;训练过程便利整个训练集一次为一轮训练;步骤5:生成预测结果基于训练过的模型,对高光谱图像中所有像素进行类别预测,然后将预测的类别放到对应的位置,得到预测结果图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811544066.1/,转载请声明来源钻瓜专利网。