[发明专利]基于注意力多尺度特征融合的遥感图像语义分割方法在审
申请号: | 201911098961.X | 申请日: | 2019-11-12 |
公开(公告)号: | CN111127493A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 周勇;何欣;赵佳琦;夏士雄;张迪;姚睿;刘兵;杜文亮 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/12;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 221116 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 尺度 特征 融合 遥感 图像 语义 分割 方法 | ||
本发明公开了一种基于注意力多尺度特征融合的遥感图像语义分割方法,通过搭建基于注意力多尺度特征融合的语义分割网络,构建训练数据集,采用所述训练数据集进行网络参数训练。在测试时使用训练好的网络对待测数据进行语义分割。所述网络是一种轻量级的编码器‑解码器结构。其中引入了图像级联网络的思想,同时利用注意力机制优化编码特征与解码特征,构造出多尺度注意力优化模块、多尺度特征融合模块、边界增强模块,提取和融合不同尺度的特征图,并使用多尺度的语义标签和边界标签指导训练,能够有效进行遥感图像的语义分割。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于注意力多尺度特征融合的遥感图像语义分割方法。
背景技术
目前,语义分割已经成为计算机视觉领域的关键问题之一。从宏观角度来分析,语义分割是一种为场景理解打好基础的高层任务。现实中有大量的应用场景需要从影像资料中推理出相关的知识或语义(即由具体到抽象的过程)。这些应用包括了无人驾驶、医疗健康、图像搜索引擎、增强现实等方面。通过应用各种计算机视觉的传统方法和机器学习技术,已经可以很好的解决这些问题。然而深度学习的迅猛发展,使得这些方法逐渐失去人们的青睐。近年来,在语义分割领域的学者采用卷积神经网络CNN,来实现图像的高层语义特征的提取,比较流行的网络模型如UNet、ResNet、DeepLab等等。实验表明其在性能方面和时间消耗方面都远远超过传统方法。
随着地理空间信息应用的不断深入,如何充分并且准确地提取遥感图像的信息变得尤为重要。遥感图像语义分割作为遥感领域的一项研究热点,在土地管理、灾害预测等民用领域以及军事上有着广泛的应用前景。
不同于城市街景等普通自然图像,高分辨率遥感图像通常包括道路、水源、建筑物、树木等地物目标类别丰富的细节信息。其具有如下特点:
(1)个别目标尺度较小,遥感图像中存在着大量的建筑物、树木等小目标,使得特征难以提取;
(2)类间存在相似性,类内存在异质性,比如公路与水泥地面之间的差异性低,建筑物的顶部各不相同;
(3)不同目标边界重叠,比如树木和建筑物的阴影会产生遮挡问题。
上述这些特点都对现有的深度学习模型学习鲁棒的特征表示提出了新的挑战,这是提高遥感图像语义分割精度的关键。并且带有标签的遥感数据集非常少,限制了深度学习网络在语义分割应用中的发展,导致模型容易出现过拟合现象。
发明内容
针对以上问题,本发明提出一种基于注意力多尺度特征融合的遥感图像语义分割方法。
为实现本发明的目的,提供一种基于注意力多尺度特征融合的遥感图像语义分割方法,包括如下步骤:
S10,搭建基于注意力多尺度特征融合的初始语义分割网络;该步骤具体包括:
S11,建立预设分辨率图像的深度语义分割网络特征编码器;
S12,构造特征解码器;
S13,根据所述深度语义分割网络特征编码器和所述特征解码器确定所述初始语义分割网络;
S20,构建训练数据集,采用所述训练数据集并对基于注意力多尺度特征融合的语义分割网络进行参数训练,得到基于注意力多尺度特征融合的模型语义分割网络;该步骤具体包括:
S21,将原始数据集语义真值标签使用最邻近插值法进行压缩,对原始数据集进行边界检测,获取边界真值标签,以确定训练数据集;
S22,将所述训练数据集输入所述初始语义分割网络进行网络参数训练,依据训练结果确定模型语义分割网络;
S30,将待测数据输入所述模型语义分割网络,以对所述待测数据进行语义分割;该步骤具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911098961.X/2.html,转载请声明来源钻瓜专利网。