[发明专利]遥感影像的聚类方法有效

专利信息
申请号: 201210022353.2 申请日: 2012-02-01
公开(公告)号: CN102609721A 公开(公告)日: 2012-07-25
发明(设计)人: 唐宏;陈云浩;慎利;齐银凤 申请(专利权)人: 北京师范大学
主分类号: G06K9/62 分类号: G06K9/62;G06K7/00
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹
地址: 100875 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 遥感 影像 方法
【说明书】:

技术领域

发明涉及图像分析技术领域,尤其涉及一种遥感影像的聚类方法。 

背景技术

潜狄利克雷分配模型(Latent Dirichlet Allocation,LDA)是由Blei等人于2003年提出的一种用于文本建模的概率主题模型。借助于概率图模型的表达方式,它能够对“词”、“文档”和“主题”之间的条件概率关系进行建模,充分挖掘文档和词两个层面的概率语义信息。 

一般认为,第一次提出的真正意义上的概率主题模型是由Hoffmann在1999年基于潜语义分析模型(Latent Semantic Analysis,LSA),摒弃原来复杂的奇异值分解分析方式,从生成模型的角度构建的概率潜语义分析(Probabilistic Latent Semantic Analysis,pLSA)模型,其被成功应用于文本分析。 

然而,由于pLSA模型在文档层面没有建立合适的概率框架,而将这一级所有变量都看作模型的参数,即有多少文档那么就有多少模型的参数与之对应,因此,待估计参数的数量随着文档数量的增多呈线性增长,从而使得模型易出现过拟合且缺乏对新文档的处理能力。 

作为对pLSA模型的重大改进,LDA模型是完全的生成模型,它通过引入一个超参数,将文档中主题的混合比例分布视为服从Dirichlet先验的多项式分布,而非于特定文档直接关联的个体参数的集合,因此克服了pLSA模型存在的过拟合问题。此外,针对不同的实际应用需求,以pLSA和LDA模型为基础,也演变发展出了一系列其他的概率主题模型。尽管可能存在某些处理上的差异性,概率主题模型一般具备共同的基础理论假设,即认为文档是由若干主题的混 合,而每个主题则是一个关于词的概率分布。不借助任何监督信息的情况下,该类模型可以自动挖掘数据中的主题信息和语义信息,这为基于统计学习理论的自然语言理解开辟了新的思路。 

由于概率主题模型可较好的分析文档、主题以及词之间的统计相关关系,该类模型在计算机视觉、模式识别等领域均有较好的应用,在自然图像识别、检索、场景分析中有着许多成功的应用案例。与此同时,将概率主题模型的建模对象映射到面向对象高分辨率遥感影像的分析对象,即“词”对应“像素”、“文档”对应特定模式的“像素簇”、“主题”对应“地物类别”中心,那么每个像素簇内像素类别归属的判别问题十分自然地被转换为判别每个文档中视觉词的主题归属问题。因此,概率主题模型的内在特点与高分辨率遥感影像信息提取的应用需求十分吻合,借鉴其在自然图片处理与分析中应用的成功示例,将其应用到遥感影像分析领域是可行的。 

目前,概率主题模型在文本建模或计算机视觉的图像分割或识别应用中,文档都是事先给定的,且在建模过程中是被假设成相互独立的。在遥感影像信息提取中,人们需要以某种方式从给定的遥感影像中产生出供概率主题模型建模的文档,例如图像中的分割体或小的图像块。一旦产生了这些文档,在建模过程中它们仍然是被假设成相互独立的。然而,为了体现遥感影像中(像素或地物之间的)空间相关性,必须要求这些文档存在一定程度的重叠。换而言之,文档之间不是相互独立的,存在较强的相关性。然而,在目前这种模式下,不同文档中的相同像素可能会被概率主题模型标识为不同的语义类别,通常需进一步后处理以去除这种歧义,并且文档的数量会随着重叠程度的增加而成急剧增长。此外,概率主题模型在文本分析时一般假设文档是无序的词的集合,但这种基于“词袋”模型(bag of words)的假定忽略了视觉词之间可能存在的空间相关性,因此在用于遥感影像分析建模时并不合理。因此,如何融入视觉词之间的词序、语法或句法信息, 将有助于进一步挖掘像素层面上的空间上下文信息。 

遥感影像的聚类算法依据分析基元,可划分为基于像元的聚类与基于对象的聚类。由于基于像元的影像聚类算法主要利用像元的光谱信息来进行分析,缺乏空间信息的引入,因此高分辨率遥感影像的聚类结果中往往存在明显的“椒盐”现象,从而影响聚类结果的效果。与此不同的在于,面向对象的聚类算法分析基元往为影像对象,如分割算子获取的影像斑块。一般而言,影像对象的获取往往严重依赖于分割算法获取分割斑块的好坏,而影像分割是目前图像处理领域中一个较难解决的问题,目前尚未有较好的通用影像分割算法。一般而言,目前有很多聚类算法中对于空间信息能够在一定程度上进行利用,但是对于像元之间的语义信息的考虑,目前还很少有此类算法应用于遥感影像聚类分析。 

综上所述,现有的遥感影像的聚类算法,由于需要事先生成浩瀚的文档集,其计算复杂度高、存储开销大,并且文档之间的相关性较差,对遥感影像地理目标的检测效率低。 

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210022353.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top