[发明专利]基于相关系数冗余度的高光谱数据有监督分类方法在审
申请号: | 201410840648.X | 申请日: | 2014-12-30 |
公开(公告)号: | CN104463229A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 张淼;张晔;沈毅 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 高媛 |
地址: | 150000 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相关系数 冗余 光谱 据有 监督 分类 方法 | ||
技术领域
本发明属于遥感图像信息处理领域,涉及一种优化训练数据及分类器参数的高光谱数据有监督分类方法。
背景技术
高光谱遥感图像分类是高光谱遥感图像信息处理领域的重要内容,依据是否使用类别的先验知识可分为有监督分类及非监督分类,有监督分类精度要高于非监督分类,因而适用于遥感图像的精细分类应用。分类概念在不同应用中也不尽相同,在高光谱图像分类研究中,对于有监督分类来说,研究人员首先要为每个类别选择有代表性的像素(或称像元)集合作为训练样本。高光谱成像设备由于强调谱分辨率,往往在空间分辨率上有所牺牲,因此通过视觉检验选择合适的训练样本是一件非常依赖分析人员经验的工作。此外,还常常需要借助其他信息,如土地数据或现有地图等来为每个类别选择具有代表性的训练样本。对于有监督分类来说,同一类别的样本需要具有同性质,同时也需要满足一定的方差范围。因此在实际应用中,就需要选择多个训练样本区域或集合。如果类别方差较大,那么选择训练区域也是很费力的,同时我们也不能确定选择的训练样本是否完全适合图像分类。因此,选择和筛选训练样本是一项非常依赖研究人员判断力、同时非常耗时的工作。
支持向量机(Support Vector Machine,SVM)算法是在统计学习理论基础上发展起来的分类方法,在小样本、非线性及高维模式分类方面具有独特优势,因此对于波段数目众多(一般在100至1000)的高光谱数据一直具有比较优秀的分类效果。SVM是在线性分类器基础上,通过引入结构风险最小化原理、最优化理论及核方法演化而成,是统计学习中最有效也是应用最广的方法,在高光谱数据分类应用中能有效克服Hughes现象(即分类精度随着波段数目的增加反而减少)。此外,SVM能直接对高维数据进行计算,不必经过降维处理,这样采用全部波段数据进行分类保证了光谱信息应用的充分性和完整性,因此在很多高精度分类任务中,往往都是采用全波段数据并在高性能工作站上进行运算的。
发明内容
为了解决在高光谱分类方法中难以对训练样本进行有效筛选的问题,本发明提供了一种基于相关系数冗余度的高光谱数据有监督分类方法。该方法通过计算单次选择样本集合的相关系数冗余度来辅助自动筛选训练样本,并将遗弃样本用于分类器参数的自动寻优,使得SVM分类器算法的分类精度得到了有效提升,并通过精简支撑向量减少了时间消耗,使之在处理高光谱遥感图像的高精度分类任务中更具实用价值。
本发明针对高光谱遥感图像分析人员面对的具体任务,设计了一种辅助筛选训练样本并提供参数寻优的分类方法。在筛除训练样本中的不合格像素或次优像素时,提出了分析多变量输入之间非线性相关信息含量的相关系数冗余度,从而能够一次对E×1个像素的线段采样器内的M个预选择像素进行整体评估,保证选出的像素能够实现整体有用分类信息量的最大化;同时,将遗弃的训练样本有效地结合到SVM分类器的参数选择过程中;最后借助SVM分类器算法对分析人员关心的测试样本进行自动分类,实现了一套快速、准确的有监督分类方案。具体实施步骤如下:
步骤一、利用相关系数冗余度自动筛选有监督分类所需要的训练样本集合:
1)对于拍摄的高光谱遥感图像其中Row,Column表示高光谱遥感图像的宽和长,B表示高光谱遥感图像的波段数目,由图像分析人员按照E×1的线段采样器选择训练样本;
2)针对人工选择的训练样本进行自动筛选,设定每次保留的像素为M个,要求M<E,即删除掉了E-M个训练样本的像素;
3)计算所有可能选择的M个像素P1,...,PM的相关系数冗余度,并选出数值最大的一个相关系数冗余度,即则便是从E个像素中保留的M个像素;
4)对本次选择的E个像素统一标注一个确定的类别标号Class*,将保留的M个像素以数据对的形式归入训练样本集合,剩余的E-M个像素也以数据对的形式归入遗弃样本集合;
5)如果需要继续选择更多的训练样本,则返回1),否则进行步骤二。
步骤二、对SVM核函数的参数进行寻优:
1)根据SVM分类器核函数的不同特点,选用具有对称内积的径向基函数(Radial Basis Function,RBF)作为支持向量机的核函数,RBF形式为:其中σ为宽度参数,对参数σ进行以下数据的遍历筛查:σ∈{0.01,0.1,1,10};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410840648.X/2.html,转载请声明来源钻瓜专利网。