[发明专利]基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法有效
申请号: | 201910757947.X | 申请日: | 2019-08-16 |
公开(公告)号: | CN110598564B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 杨海平;夏列钢 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/764;G06V10/774;G06K9/62;G06N20/00 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 openstreetmap 空间 分辨率 遥感 影像 迁移 学习 分类 方法 | ||
1.基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法,以下把OpenStreetMap简称为OSM,包括如下步骤:
步骤1:基于OSM数据自动生成目标域样本集,包括以下过程:
(11)准备研究区的高空间分辨率遥感影像和相同空间范围的OSM数据,选择稳定、明显的控制点,对栅格影像与矢量数据进行空间配准;
(12)基于OSM数据生成像素级标签,过程如下:
(12a)对于需要把目标域影像分为n种地类的情况,n1,记类型集合为Y={1,2,...,n},根据类型集合Y,从OSM数据中挑选感兴趣的标签,把OSM标签合并为集合Y中的一类或保持原始标签不变,给OSM矢量数据表中新建字段class,class的值为OSM对应集合Y中类别的编号;
(12b)把矢量OSM数据栅格化,栅格的像素值为OSM矢量表中class字段对应的值,栅格的空间分辨率与目标域影像一致,由此得到目标域影像的像素级标签;
(13)目标域影像对象生成及特征计算,过程如下:
(13a)采用影像分割算法获取一系列具有空间同质性的影像对象,这里采用均值漂移算法分割目标域影像:首先,把影像转换至LUV特征空间,转换后每个像素的空间位置与特征对应一个5维向量(x,y,l*,u*,v*),其中,x和y表示空间位置,l*表示图像亮度,u*和v*表示色度;确定核函数及带宽后对LUV图像进行均值漂移滤波;在此基础上,对影像进行聚类并标记区域,从而实现影像分割;
(13b)计算影像对象的光谱、纹理和几何特征:采用波段计算获得影像对象的归一化植被指数均值与标准差、归一化水体指数均值与标准差,采用光谱统计信息获取影像对象各波段的最大值、最小值、均值与标准差,采用影像对象的几何形状获取其边长、长度、宽度、长宽比、对称度、紧致度、形状指数、角点数目、主方向,采用灰度共生矩阵计算影像对象的相异性、同质性、对比度、角二阶矩、熵、最大概率的六类纹理信息;
(14)目标域样本集生成,过程如下:由步骤(12)中栅格化的OSM类别信息和步骤(13)中得到的目标域影像对象,按空间位置统计目标域影像对象中每种类型出现的比例,当占比最大的类型比例超过阈值θ时,该类型会被选为对象的标签,具体规则如下:
其中,Oi表示目标域影像中第i个对象,Pj表示在对象中出现的第j个类别的比例,Nj表示第j个类别在对象中出现的像素总数,表示影像对象Oi中的像素总数,θ表示选取标签的阈值,范围在0.8~1.0之间;由此,可获得目标域样本集其中,表示第i个目标域样本的特征矢量,表示第i个目标域样本的类别,T表示目标域样本的总数;
步骤2:基于源域影像历史分类图自动生成源域样本集,包括以下过程:
(21)搜集和目标域影像具有相同成像传感器的高空间分辨率遥感影像作为源域影像,源域影像选择时要求与目标域影像空间范围、成像时间较接近,并且有相应的历史影像分类图;
(22)采用影像分割算法获取一系列具有空间同质性的源域影像对象,分割方法和步骤(13a)一致;
(23)计算源域影像对象的光谱、纹理和几何特征,方法同步骤(13b);
(24)结合源域影像历史分类图的类型信息,按照步骤(14)的对象标签赋值方法,给源域影像对象标记类型标签;由此,可获得源域样本集其中,表示第i个源域样本的特征矢量,表示第i个源域样本的类别,S表示源域样本的总数;
步骤3:将由步骤1中生成的目标域样本集和步骤2中生成的源域样本集组成的混合训练样本集L={Li|(Li∈Ls)OR(Li∈Lt),i=1,2,...,S+T}作为算法的输入,采用基于随机森林的迁移学习算法训练分类器,包括以下过程:
(31)设集合L中每个样本的权重为w,初始化权重
(32)设样本集合L'={Li|Li∈L,i=1,2,...,N'}参与训练分类器,N'的初始值为S+T,将L'中的样本权重归一化:
(33)采用样本集L'训练随机森林模型f(x),模型中有h棵树,模型训练流程如下:
(33a)从样本集L'中有放回的抽取N'个训练样本,随机选取影像对象中s个特征参与分类树的训练;
(33b)采用CART算法生成分类树,分类树生成时没有减枝过程;
重复步骤(33a)与(33b),直到h棵树全部生成为止;
(34)计算随机森林模型f(x)在目标域样本集上的错误率e:
其中,Fi在分类正确时记为0,分类错误时记为1;
(35)更新源域样本的权重:
其中,R为总循环次数;
更新目标域样本的权重:
(36)计算当前循环中随机森林模型f(x)的重要性:
(37)进入步骤(32),直至循环R次结束;
步骤4:目标域影像对象类型预测,采用步骤3中获取的影像分类器对目标域影像对象进行预测,每个影像对象的类型预测结果为:
其中,α(i)表示第i次循环得到的模型重要性,y(i)表示第i次循环得到的模型预测结果;由此获得目标域影像的最终分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910757947.X/1.html,转载请声明来源钻瓜专利网。