[发明专利]多光谱遥感图像城中村多类别建筑物语义分割方法及系统有效
申请号: | 202011516168.X | 申请日: | 2020-12-21 |
公开(公告)号: | CN112633140B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 郭玉彬;徐嘉树;李西明 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/26;G06V10/764;G06V10/82;G06N3/0464;G06N3/0455;G06N3/096 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 510642 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光谱 遥感 图像 城中村多 类别 建筑物 语义 分割 方法 系统 | ||
1.一种多光谱遥感图像城中村多类别建筑物语义分割方法,其特征在于,所述方法包括:
获取城中村区域的多光谱遥感图像;
对多光谱遥感图像进行大气校正并锐化;
对多光谱遥感图像中的城中村建筑物类别进行标注;
将多光谱遥感图像的各波段信息转换成npy格式数据;
将npy格式数据和标注图像进行随机分割,构成数据集;
搭建语义分割分类器,得到建筑语义分割网络模型;
对建筑语义分割网络模型设置超参数,利用数据集进行训练与参数优化,得到训练好的建筑语义分割网络模型;
利用训练好的建筑语义分割网络模型对目标多光谱遥感图像进行建筑物语义分割,得到建筑语义分割图像;
所述建筑语义分割网络模型包括通道变换模块、编码器-解码器模块和预测模块;
所述通道变换模块包括两个核为1×1、步长为1的卷积层,第一个卷积层将a通道的输入经过1×1的卷积操作扩充图像的特征通道数量;第二个卷积层对扩充后的特征通道进行线性组合,将具有a波段的多光谱遥感图像,转换成具有三个通道的特征图像;
所述编码器-解码器模块用于对通道变换模块输出的特征图像进行特征信息提取,并将得到的特征图像输入预测模块,包括卷积层、池化层、上采样层、连接层、特征卷积模块和压缩卷积模块;其中,对特征图像进行压缩尺寸操作的部分为编码器,对特征图像尺寸还原的部分为解码器;
所述编码器-解码器模块对通道变换模块输出的特征图像进行特征信息提取分为五层,具体包括:
在第一层中,针对经过通道变换模块后的特征图像,使用两个卷积核为3×3的卷积层提取特征信息,并且转变特征图像的通道数为32;使用连接层将通道数量为32的特征图像与解码器得到的通道数量为64的特征图像进行连接;使用两个卷积核为3×3的卷积层对连接后的特征图像提取特征信息,改变通道数量为32;将得到的特征图像输入预测模块;
在第二层中,针对经过通道变换模块后的特征图像,使用zeropad将特征图像用0扩充3×3的尺寸;通过卷积核为7×7、步长为1的卷积层将特征图像压缩为原来尺寸的1/2,通道数量转换为64,使用连接层将通道数量为64的特征图像与解码器得到的通道数量为128的特征图像进行连接;使用两个卷积核为3×3的卷积层对连接后的特征图提取特征信息,改变通道数量为64;将特征图像输入上采样层;
在第三层中,将第二层压缩后的特征图像,使用核为3×3、步长为2的池化层将特征图尺寸压缩为原来的1/2,输入压缩卷积模块;使用两个特征卷积模块提取特征信息,得到通道数量为128的特征图像,使用连接层将通道数量为128的特征图像与解码器得到的通道数量为256的特征图像进行连接;使用两个卷积核为3×3的卷积层对连接后的特征图像提取特征信息,改变通道数量为128;将特征图像输入上采样层;
在第四层中,将第三层经特征卷积模块得到的通道数量为128的特征图像,输入压缩卷积模块;使用三个特征卷积模块提取特征信息,得到通道数量为256的特征图像,使用连接层将通道数量为256的特征图像与解码器得到的通道数量为512的特征图像进行连接;使用两个卷积核为3×3的卷积层对连接后的特征图像提取特征信息,改变通道数量为256;将特征图像输入上采样层;
在第五层中,将第四层经特征卷积模块得到的通道数量为256的特征图像,输入压缩卷积模块;使用五个特征卷积模块和两个卷积核为3×3的卷积层提取特征信息,得到通道数量为512的特征图像;将特征图像输入上采样层。
2.根据权利要求1所述的多光谱遥感图像城中村多类别建筑物语义分割方法,其特征在于,所述对建筑语义分割网络模型设置超参数,利用数据集进行训练与参数优化,得到训练好的建筑语义分割网络模型,具体包括:
基于迁移学习的方法,使用预训练模型权重作为建筑语义分割网络模型的超参数,或者使用随机初始化设置建筑语义分割网络模型的超参数,将预训练的迭代次数设置为PreEpoch,利用数据集调整建筑语义分割网络模型的权重;
将正式训练的迭代次数设置为ResEpoch,利用数据集对建筑语义分割网络模型进行训练与参数优化,将每次迭代的最佳建筑语义分割网络模型存储起来,迭代结束得到最优的建筑语义分割网络模型,作为训练好的建筑语义分割网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011516168.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低扭矩全行程调节的三通旋塞调节阀
- 下一篇:一种化工颜料破碎筛选装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序