[发明专利]一种基于混合度量的高光谱图像分类方法有效
申请号: | 202110486966.0 | 申请日: | 2021-05-03 |
公开(公告)号: | CN113111969B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 葛海淼;潘海珠;刘沫岐;马卉宇 | 申请(专利权)人: | 齐齐哈尔大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06V10/74;G06V10/774 |
代理公司: | 哈尔滨市文洋专利代理事务所(普通合伙) 23210 | 代理人: | 何强 |
地址: | 161006 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 度量 光谱 图像 分类 方法 | ||
1.一种基于混合度量的高光谱图像分类方法,其特征在于,包括如下步骤:
A.局部异常因子算法
该算法基于对象的邻域密度来判断对象的异常程度,首先,klof属于任意正整数,定义x的第k距离为x与某个对象o之间的距离,记为dis_klof(x),其中对象x与对象o之间的距离记为d(x,o);
B.二元光谱相似性度量
给定两个光谱向量x和y,x=(x1,x2,…xn),y=(y1,y2,…yn),n是光谱波段总数,包括光谱角度量(Spectral angle metric,SAM)、光谱梯度角(Spectral gradient angle,SGA)、光谱相关角(Spectral correlation angle,SCA)、光谱信息散度(Spectral informationdivergence,SID);
C.基于k-NN和SVM的自训练算法
首先用有标记的数据集训练分类器,并使用该分类器对未标记样本分类;之后,通过某种策略,判断未标记样本的置信度,将高置信度的未标记样本添加到有标记样本集中;重复该过程,直到满足迭代终止条件;采用启发式的方法来选择高置信度的未标记样品;k-NN算法用于确定未标记样本的分类标记;SVM则用于加强自训练策略,以帮助k-NN标记未标记的样本;令L和U分别表示标记样本集和未标记样本集,基于k-NN和SVM的自训练过程可以描述如下:
输入:
L:标记样本集
U:未标记样本集
1使用L训练SVM分类器
2使用k-NN为U中的未标记样本指定标签
3使用SVM为U中的未标记样本指定标签
4确定其成员为2和3两步操作后具有相同标签的样本
5确定其成员为由SVM挑选的高置信度的样本
6U=U-V
7L=L+V
End while;
D.基于混合测量k-NNSVM的自训练分类器
使用k-NN选择最接近标记样本的kknn未标记邻居样本,同时,引入空间距离和LOF距离,结合光谱距离来度量光谱样本的相似性,根据空间域平滑假设,标记样本周围的一定空间内,其邻居样本大概率与该标记样本属于同一类;
使用k-NN选择最接近标记样本的kknn未标记邻居样本;并引入空间距离和LOF距离,结合光谱距离来度量光谱样本的相似性;根据空间域平滑假设,标记样本周围的一定空间内,其邻居样本大概率与该标记样本属于同一类;将空间距离定义为:
其中Sx,Sy为样本x和y的空间坐标,||·||L1为L1范式; 将LOF距离定义为:
LOF′(x,y)=|LOF(x)-LOF(y)|
disLOF(x,y)=eLOF′(x,y)
其中LOF′(x,y)是LOF(x)-LOF(y)的绝对值,而disLOF(x,y)是x和y之间的LOF距离;结合空间距离,光谱距离和LOF距离,可以将光谱数据混合度量定义为:
disMM(x,y)=dis′SIDSAM(x,y)×dis′NB(x,y)×disLOF(x,y)
其中dis′SIDSAM(x,y)和dis′NB(x,y)分别是disSIDSAM(x,y)和disNB(x,y)的归一化值,以消除数据量纲的影响;
基于混合度量k-NNSVM的自训练分类器的性能取决于LOF和k-NN算法的性能;同时,LOF和k-NN的质量受参数klof和kknn的影响;采用自适应方法来自动获取这两个参数:
其中Ni是通过SVM分类得到的第i类样本数,表示向上取整;是由SVM得到的属于第i类的未标记样本数量; 从公式中可以看出,klof和kknn是由SVM算法确定的Ni和通过计算得到;算法的整体实现如下:
Inputs:
L:标记样本集
U:未标记样本集
iter_max:最大迭代次数
For(iter=1;iter<=iter_max;iter++)
使用标记样本集L训练SVM分类器
L′为L的子集,代表L中被SVM正确分类的样本集
计算L和U的LOF
获得L′中的类别数目c
for(i=1;i<=c;i++)
L′i为L′的子集,其中的元素被SVM分为i类
Ui为U的子集,其中的元素被SVM分为i类
获得ni,是L′i中样本数
for(j=1;j<=nj;j++)
计算U和L′ij之间的距离disSIDSAM,其中L′ij是L′i中的样本j计算U和L′ij之间的距离disNB
将disSIDSAM,及dNB归一化到[1,10],得到dis′SIDSAM和dis′NB;
计算U和L′ij之间的距离disLOF
计算disMM=dis′SIDSAM*dis′NB*disLOF
end for
Vi为U的子集,其元素为k-NN混合相似度量disMM确定的可靠样本
end for
将高置信度样本集Vi合并得V
U=U-V
L=L+V
End For。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐齐哈尔大学,未经齐齐哈尔大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110486966.0/1.html,转载请声明来源钻瓜专利网。