[发明专利]基于梯度提升决策树半监督算法融合的高光谱图像分类方法有效
申请号: | 201610561589.1 | 申请日: | 2016-07-17 |
公开(公告)号: | CN106203523B | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 张向荣;焦李成;张鑫;冯婕;白静;马文萍;侯彪;马晶晶 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 韦全生;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于梯度提升决策树半监督算法融合的高光谱图像分类方法,用于解决现有基于主动学习与半监督学习相结合的高光谱图像分类中存在的分类精度较低的技术问题,其步骤包括:(1)输入高光谱图像数据;(2)提取样本点特征;(3)训练梯度提升决策树分类器参数;(4)对学习集中样本点分类;(5)评估样本点置信度;(6)通过稀疏表示筛选样本点;(7)更新有标记训练集;(8)输出分类结果。本发明利用分类器预测结果以及稀疏表示对无标记样本点的置信度进行评估,根据无标记样本点置信度的高低,划分为两个集合进行不同的处理,在提高分类精度的同时减轻了人工标记的负担,可用于地质调查、大气污染等领域。 | ||
搜索关键词: | 基于 梯度 提升 决策树 监督 算法 融合 光谱 图像 分类 | ||
【主权项】:
1.一种基于梯度提升决策树半监督算法融合的高光谱图像分类方法,包括如下步骤:(1)输入包含C类、N个样本点的高光谱图像,对每个样本点取其邻域窗口,取该窗口内所有样本点每一维特征的最大值作为该每个样本点的空间特征,将样本点的光谱特征与空间特征串联,得到样本点的空谱特征向量;(2)从输入的高光谱图像中选取有标记训练集、学习集和测试集,实现步骤为:(2a)从输入的高光谱图像的每类样本点中,随机选取r个样本点,得到有标记训练集
其对应的类别标记集为
其中,n为有标记训练样本点总个数,且n=C×r,xi为有标记训练集的第i个有标记样本点,li为第i个有标记训练样本点所属的类别标号,li∈{1,2,…,C},R为实数域,D为样本点的特征维数;(2b)从选取的n个有标记样本点以外的样本点中,随机选取比例为per1的样本点,得到学习集
其中,s为学习集样本点总个数,且s=(N‑n)×per1,zq为学习集中的第q个样本点;(2c)利用剩余样本点构成测试集
m为测试集样本总个数,m=N‑n‑s,yj为测试集的第j个测试样本点;(3)利用有标记训练集
中的样本点的特征向量与对应的类标矩阵,对梯度提升决策树GBDT分类器参数进行训练,每两类有标记样本点可训练得到一个二分类器模型,最终,C类有标记样本点可得到C×(C‑1)/2个二分类器模型;(4)将学习集
中的样本点输入到得到的多个二分类器模型中,得到该学习集Z中每个样本点的预测类标k;(5)根据得到的学习集
中每个样本点zq的预测类标k,判断每一个二分类器模型中,每个样本点zq被分到第k类时,类标k的取胜次数P是否等于C‑1,若是,则将该样本点加入空集Ssemi中,否则,将样本点加入空集Sact中;对学习集Z中的所有样本点逐一进行判断,得到集合
和集合
其中,zq1为集合Ssemi中的样本点,zq2为集合Sact中的样本点,s'为集合Ssemi中的样本点总个数,s″为集合Sact中的样本点总个数,其中,s′+s″=s;(6)利用稀疏表示,对得到的集合Ssemi与集合Sact中的样本点进行筛选,实现步骤为:(6a)利用有标记训练集X中的所有样本点构建字典A=[x1,x2,…,xn],并利用构建的字典A,分别对集合Ssemi中的样本点zq1和集合Sact中的样本点zq2进行稀疏表示:zq1=Aα1,zq2=Aα2,其中,α1和α2是稀疏表示系数向量;(6b)利用正交匹配追踪算法OMP得到样本点zq1和样本点zq2的稀疏表示系数向量:
和
其中||·||2为l2范数,度量数据重构误差;||·||1为l1范数,用来保证向量α1和向量α2的稀疏度,λ是重构误差项与稀疏项的平衡因子;(6c)根据稀疏表示系数向量α1和α2中非零项所对应的有标记样本点的类标,即li∈{1,2,...,C},将集合Ssemi中预测类标k与类标li相同的样本点zq1筛选出来,并将筛选出的所有样本点的类标赋予类标li;同时将集合Sact中预测类标k与类标li不同的样本点zq2筛选出来,并将筛选出的所有样本点交由专家进行人工标注;(7)将集合Ssemi中赋予类标li的样本点zq1和集合Sact中进行人工标注的样本点zq2,加入到有标记训练集X中,重新训练分类器参数,得到新的分类器模型;(8)迭代步骤(3)~步骤(7),直到满足设定的迭代次数,利用最终得到的分类器模型,对测试集
中的样本点进行分类,得到测试集的分类结果![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610561589.1/,转载请声明来源钻瓜专利网。