[发明专利]基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法有效
申请号: | 201811544066.1 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109784347B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 李映;房蓓;张号逵 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/774;G06V10/764;G06K9/62;G06N3/04 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 稠密 卷积 神经网络 注意力 机制 图像 分类 方法 | ||
1.一种基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法,其特征在于步骤如下:
步骤1:数据预处理
对待处理的高光谱图像数据进行最大最小归一化,归一化公式如下:
其中xijs表示高光谱图像中的一个像元,i、j分别表示该像元位于高光谱图像中的坐标位置,s表示高光谱图像的谱段,为归一化后的一个像元,x..smax、x..smin分别表示三维高光谱图像在s谱段的最大值和最小值;
步骤2:数据分割
统计待处理的高光谱图像中,各个类别标注样本的个数,然后按照比例,从每个类别中,抽取5个标注的样本作为训练数据,剩余的部分作为测试数据;具体做法如下,对于一个尺寸为M×N×D的三维高光谱图像数据,M,N分别表示高光谱图像的高和宽,D表示数据的波段数;抽取样本时,以待处理像素为中心,抽取S×S×D的数据块作为中心像素的样本数据,S表示邻域大小;
步骤3:构建网络模型
首先深度网络使用稠密连接机制用于导出网络中的多级特征,使用三维扩张卷积,可以使用多尺度特征图生成光谱空间特征;此外,在每层网络中增加谱注意力机制策略;所述的稠密连接机制:第l层的输出是由前面所有层x0,...,xl-1的特征图连接组成的,表示为xl=F({x0,...,xl-1}),F(·)表示非线性变换;对于本网络结构使用的多尺度三维扩张卷积,第a层的第b个通道的三维扩张卷积的扩张值设置为sab=((aw+b)mod 10)+1,ω表示每层卷积层的卷积个数;所述的谱注意力机制:数据块U大小为S×S×D,从谱的方向上数据块U可以表示为Fspectral,经过谱注意力机制生成的向量为g,大小为1×1×D,得到Fsacle为加入谱注意力机制后的向量,最后生成为U’,大小为S×S×D;将谱注意力机制加入到多尺度稠密网络中,右侧网络结构为注意力机制网络结构图,在三维扩张卷积操作之后但在连接操作之前作为权重加入;
步骤4:训练网络模型
将训练数据批量的输入到构建好的深度网络中,以标注的类别为指导信号,利用梯度下降算法对网络参数进行训练,直至网络收敛;训练过程中,每次随机不重复的从训练集里抽取10-20样本为一批训练数据,将该数据输入到网络,抽取特征并计算预测结果,以预测结果与实际结果之间的交叉熵为损失函数,计算网络权值的偏导数,并利用梯度下降算法,更新网络参数;训练过程便利整个训练集一次为一轮训练;
步骤5:生成预测结果
基于训练过的模型,对高光谱图像中所有像素进行类别预测,然后将预测的类别放到对应的位置,得到预测结果图。
2.根据权利要求1所述的一种基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法,其特征在于步骤2中的S取13。
3.根据权利要求1所述的一种基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法,其特征在于步骤3中的ω取8。
4.根据权利要求1所述的一种基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法,其特征在于步骤4中的整个训练过程进行100轮,前60轮学习率设为0.01,最后40轮,学习率衰减到0.001;整个训练过程中,动量项设为0.9。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811544066.1/1.html,转载请声明来源钻瓜专利网。