[发明专利]基于改进的潜在狄利克雷分配的自然图像分类方法在审

申请号：	201410085860.X	申请日：	2014-03-11
公开（公告）号：	CN103870840A	公开（公告）日：	2014-06-18
发明（设计）人：	焦李成;刘芳;韩冰;马文萍;王爽;马晶晶;侯彪;白静	申请（专利权）人：	西安电子科技大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46
代理公司：	北京科亿知识产权代理事务所(普通合伙) 11350	代理人：	汤东凤
地址：	710071***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于改进潜在狄利克雷分配自然图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于图像处理技术领域，涉及一种对自然图像的分类方法，可用于目标识别。

背景技术

近年来，图像数量的大量激增给图像识别、检索以及分类等问题带来了巨大的挑战。如何在浩瀚的数据中准确获得用户所需信息并进行处理，成为该领域亟待解决的问题之一。自然图像分类的目的是根据图像中所包含的内容将图像划分为不同的类别，供后续处理或便于管理。经典的自然图像分类方法包括：

基于词袋模型的自然图像分类方法。该方法是由Csurka G等人将词袋BoW模型的思想移植到图像处理领域，见Csurka G，Dance C，Fan L，et al.Visual Categorization with Bags of Keypoints.Workshop on statistical learning in compute vision，ECCV.2004,1:22.，其主要思想是通过对图像进行特征提取和描述，得到大量特征进行处理，从而得到用来表示图像的关键词，并在此基础上构建视觉词典，然后对待分类图像采用相同的处理方法，将结果代入到训练的分类器中进行分类。然而，词袋模型在计算机视觉领域的应用的缺陷是在应用于图像分类时分类精度不够高，且分类时间较长。

基于潜在狄利克雷分配的自然图像分类方法。该方法是由David M.Blei等人在pLSA模型的基础上进行扩展，提出了潜在狄利克雷分配LDA，对于像语料库这样的离散数据的收集建立了概率模型，见Blei,D.M.,Ng,A.Y.,Jordan,M.I.Latent Dirichlet Allocation.Journal of Machine Learning Research3:993-1022,2003。随后Fei Fei Li等人将该模型应用于自然场景分类，见Fei-Fei L,Perona P.A bayesian hierarchical model for learning natural scene categories.Computer Vision and Pattern Recognition,2005.CVPR2005.IEEE Computer Society Conference on.IEEE,2005,2:524-531。该方法相较于词袋模型方法虽然大大缩短了分类时间，但却降低了分类精度。

发明内容

本发明的目的在于针对已有技术的不足，提出一种基于改进的潜在狄利克雷分配的自然图像分类方法，以提高分类效果。

为实现上述目的，本发明包括如下步骤：

1、一种基于改进的潜在狄利克雷分配的自然图像分类方法，包括如下步骤：

(1)采用网格分块方法对每一幅自然图像进行网格稠密采样，得到每幅自然图像相应的网格采样点；

(2)对每一个网格采样点提取其周围区域的尺度不变特征转换SIFT特征；

(3)对所有自然图像提取出来的SIFT特征进行K聚类，K聚类生成的n个聚类中心即n个视觉单词，n个视觉单词构成一个视觉词典；

(4)用每幅自然图像中网格采样点的SIFT特征分别与视觉词典中的每个视觉单词进行比较，找出与每幅自然图像中网格采样点的SIFT特征最相近的视觉单词来代替该SIFT特征，使得每幅自然图像均由n个视觉单词表示，即用量化后的每幅自然图像作为由n个视觉单词构成的视觉文档；

(5)根据空间金字塔匹配SPM对每篇视觉文档构建二层空间金字塔，第一层空间金字塔中为原视觉文档，第二层空间金字塔中为经过平均划分后得到的四个视觉子文档，则每篇视觉文档经过空间金字塔匹配后可以得到五篇视觉文档；

(6)将每幅自然图像对应的五篇视觉文档分别输入给潜在狄利克雷分配LDA模型进行若干次Gibbs采样迭代，得到每幅自然图像的五个潜在语义主题分布；

(7)将每幅自然图像的五个潜在语义主题分布顺次相连后输入给支持向量机SVM分类器进行分类，选择所有自然图像的一半的图像作为训练样本，另一半的图像作为测试样本，得到分类结果。

本发明与现有的技术相比具有以下优点：