[发明专利]一种遥感影像语义分割方法及装置有效
申请号: | 202010949878.5 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112132149B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 张觅;李小凯;邓凯;饶友琢;胡平;花卉;刘沁雯;王有年 | 申请(专利权)人: | 武汉汉达瑞科技有限公司 |
主分类号: | G06V20/70 | 分类号: | G06V20/70;G06V20/10;G06V10/26;G06V10/774;G06V10/82;G06N3/0455;G06N3/0464;G06N3/0475;G06N3/048;G06N3/0895;G06N3/094;G06N3/0985 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 方菲 |
地址: | 430000 湖北省武汉市东湖开发区*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 遥感 影像 语义 分割 方法 装置 | ||
1.一种遥感影像语义分割方法,其特征在于,包括:
通过有标记的遥感影像数据对语义分割对抗网络进行训练,其中,所述语义分割对抗网络中包含有基于注意力机制的生成器和基于置信度预测机制的判别器;
其中,所述基于注意力机制的生成器中包括:
利用对称编码-解码结构抽取有标记的遥感影像数据特征,将抽取的遥感影像数据特征X∈XH×W×C的注意力编码函数表示为特征X上所有位置的加权和:
Ci(X)=f(θ(X),Φ(X))g(X); (1)
式中,H和W分别表示特征的宽度和高度,C表示特征类别数,Ci表示注意力编码函数,θ(X)、Φ(X)和g(X)函数均表示输入特征X上的变换函数,f表示所有位置上结对变换函数,公式(1)的稀疏向量为:
式中,vec表示变换矩阵的行空间向量形式,δθ与δφ是学习到的参数θ、φ的稀疏加权算子,p是特征编码函数Ci的阶数,Γi(X)是高阶项的转换函数,若使用1×1卷积核,同时令则公式(2)表示为:
通过公式(3)计算得到生成器特征注意力编码,特征编码大小与输入特征维度相同,注意力特征编码表示为Ci(X)=vec(Ci(X))∈XH×W×C;
所述判别器中将沿着输出特征XD∈XH×W×C的通道方差作为弱监督信号,弱监督信号计算公式为:
其中,Var表示通道方差,表示输出特征的第i通道,为判别器输出特征的所有通道的均值,C表示特征类别数;
通过未标记的遥感影像数据对所述语义分割对抗网络进行训练,采用生成器权值共享对未标记遥感影像数据进行预测,并在判别器上生成置信度图;
根据预定义的损失函数,通过有标记的遥感数据和未标记的遥感数据对语义分割对抗网络迭代训练,优化超参数,以基于迭代优化后的语义分割对抗网络对待识别遥感影像数据进行语义分割;
其中,所述预定义的损失函数包括总体损失函数,所述总体损失函数为:
式中,表示生成器的损失函数,表示判别器的对抗损失函数,表示训练过程中判别器产生的半监督信号损失,λadv,λsemi分别表示判别器对抗损失与半监督信号损失的调整系数;
所述生成器的损失函数采用多类别的语义分割交叉熵损失函数,表示为:
式中,表示从有语义分割标注的数据集中获取的影像及影像相应的标签,h,w表示影像对应标注的宽度和高度,c是影像上每个像素所属类别,G(·)表示生成器的预测函数,根据生成器的预测函数确定影像数据语义分割的预测结果;
所述判别器的对抗损失函数目标是使生成器的预测函数,若D(·)表示判别器的预测函数,则判别器对抗损失函数的最小化可表示为:
式中,‖E‖表示数学期望E的绝对值损失;
半监督学习的损失函数用于监督模型训练时的未标记的遥感影像语义分割数据集和有标记的语义分割数据集代表半监督语义分割网络训练时的置信度,其中,半监督损失函数定义为:
式中,表示来自有标记或未标记的训练数据,Var表示通道方差,I为二值标记矩阵,当矩阵I的元素大于阈值εsemi时取1,小于等于阈值εsemi时取0。
2.根据权利要求1所述的方法,其特征在于,所述在判别器上生成置信度图还包括:
将所述置信度图作为半监督信息,并根据置信度图调整网络参数学习状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉汉达瑞科技有限公司,未经武汉汉达瑞科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010949878.5/1.html,转载请声明来源钻瓜专利网。