[发明专利]用于遥感图像场景分类的层次型非线性子空间字典学习方法在审
申请号: | 202111290301.9 | 申请日: | 2021-11-02 |
公开(公告)号: | CN113963224A | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 周国华;陆兵;徐亦卿;申燕萍 | 申请(专利权)人: | 常州工业职业技术学院 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/772;G06V10/774;G06V10/776;G06V10/764;G06V20/10;G06V20/13;G06K9/62 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 朱晓凯 |
地址: | 213164 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 遥感 图像 场景 分类 层次 非线性 空间 字典 学习方法 | ||
用于遥感图像场景分类的层次型非线性子空间字典学习方法,HNSDL使用层次型非线性方法将数据样本投影到一系列子空间中并实现数据降维;为提高模型的辨识能力,在学习过程中引入稀疏编码的局部结构约束项。本方法取得如下的技术进步:(1)与现有的线性变换矩阵的线性方法不同,所提方法通过一系列非线性函数将数据映射到一系列投影空间。与线性变换矩阵相比,非线性投影能更好地表现遥感图像的非线性结构。(2)利用带标签信息的局部结构约束项,字典学习不仅保留了数据的非线性局部结构,而且使得类内样本紧凑,增强了字典的类别可分性。(3)投影空间学习和字典学习在一个模型同时学习,参数的优化使用交替迭代优化方法,使得模型的参数可以同时得到最优解。
技术领域
本发明涉及遥感图像处理领域,具体涉及一种用于遥感图像场景分类的层次型非线性子空间字典学习方法。
背景技术
随着计算机科学、遥感、通信工程等多个领域的快速发展,遥感图像呈爆炸式增长,使得大规模地表监测成为可能。基于遥感图像的自动地表覆盖分类在城市规划有着重要的应用价值。遥感图像的地表覆盖分类通常基于监督学习方法,许多机器学习模型,如支持向量机、马尔可夫随机场、随机森林等,已被广泛应用于高光谱图像分类。然而,这些方法只考虑了遥感图像的光谱特征,而忽略了图像中隐藏的稀疏性和空间信息。因此,相应的分类结果一般不令人满意。此外,遥感图像还存在类内差异大等特点。在不同的图像采集条件下,由于植被组成、土壤湿度和地形等原因,新图像中的光谱特征可能会发生显著变化;甚至由于季节性、照明条件和太阳角度的变化,同一片土地覆盖类型的遥感图像也会呈现出明显的差异。虽然深度学习在遥感图像分类中有着巨大的应用潜力,但它也面临着新的挑战。首先,遥感图像的一个小数据块就包含了大量的信息,深度学习模型中的数百个频带需要消耗大量的神经元。其次,训练动态学习模型往往需要大量标注样本,但是,对新场景中的遥感图像进行大量标注是困难和耗时的。第三,遥感图像的高空间分辨率和丰富的光谱信息使得直接构造深度学习模型进行分类往往效果不佳。
在这种情况下,字典学习成为解决这类问题的一种有效方法。字典学习在图像处理和计算机视觉中有突出表现,通过学习所有类的共享词典使得稀疏编码具有判别性。字典学习在处理遥感图像时也是有效的,遥感图像用字典中的若干个元素即可表示,同一类别图像的共同特征通常位于低维子空间中。此时,简单的稀疏系数就可以表示丰富的遥感图像信息。但目前提出的方法的不足在于它们均在样本的原始空间进行字典学习,一是由于遥感图像的高维特性使得字典学习中的内存使用和计算复杂性随着维数的增加而急剧增加,分类性能也会受到维数灾难的影响。二是对于遥感图像分类这类复杂问题,样本间的非线性关系不能在样本的原始空间中很好地得到利用。为了应对高维数据带来的挑战,通常采用降维技术将原始高维数据投影到低维的潜在空间,然后在低维空间中学习所需的词典。主成分分析及其扩展是用于降维的最具代表性的算法。尽管它们易于实现,但它们可能无法完全保留字典学习的最佳特性,因为这些方法中的大多数只是将降维和字典学习作为两个单独的阶段来执行。
发明内容
为解决上述背景技术中存在的问题,本发明提出了一种用于遥感图像场景分类的层次型非线性子空间字典学习(Hierarchical nonlinear subspace dictionarylearning,HNSDL)方法。HNSDL使用层次型非线性方法将数据样本投影到一系列子空间中并实现数据降维;为提高模型的辨识能力,在学习过程中引入稀疏编码的局部结构约束项;在多个真实遥感图像数据集上的实验表明,提出的方法对于遥感图像场景分类是有效的。具体而言,本发明取得如下的技术进步:(1)与现有的线性变换矩阵的线性方法不同,所提方法通过一系列非线性函数将数据映射到一系列投影空间。与线性变换矩阵相比,非线性投影能更好地表现遥感图像的非线性结构。(2)利用带标签信息的局部结构约束项,字典学习不仅保留了数据的非线性局部结构,而且使得类内样本紧凑,增强了字典的类别可分性。(3)投影空间学习和字典学习在一个模型同时学习,参数的优化使用交替迭代优化方法,使得模型的参数可以同时得到最优解。
用于遥感图像场景分类的层次型非线性子空间字典学习方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州工业职业技术学院,未经常州工业职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111290301.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:液态镜头的自动对焦方法、装置及存储介质
- 下一篇:匀质板布料装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序