[发明专利]一种基于多标签的图像识别方法无效
申请号: | 201110313956.3 | 申请日: | 2011-10-17 |
公开(公告)号: | CN102364498A | 公开(公告)日: | 2012-02-29 |
发明(设计)人: | 朱玉全;陈耿;孙蕾;廖定安;梁军 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 图像 识别 方法 | ||
技术领域
本发明属于图像的计算机分析技术的应用领域,具体涉及一种具有多标签图像的识别方法。
背景技术
图像识别是数据挖掘技术中的一个重要研究分支,它旨在通过训练图像样本数据集来构造一个分类函数或分类器,并利用该分类函数或分类器来识别待测图像的标签或标签集。在传统的被称为多类单标签图像识别问题中,每个图像数据只含有一个与之对应的标签。然而,在实际应用中,由于客观事物本身的复杂性,一幅图像可能同时包含多个不同的标签,比如在风景图识别中,一幅图像可以同时拥有“树林”、“ 山峰”、“草原”等主题;在医学图像识别中,一张医学图像可同时包含与“糖尿病”、”前列腺”等疾病相关的信息。与单标签分类问题不同的是,多标签分类问题的目标是寻找与待测图像数据相联系的标签集或一组标签,而不是单一标签。长期以来,单标签分类问题得到了广泛而深入的研究,各种性能较好的分类算法不断地被提出,并在图像识别领域中得到了成功应用,如基于决策树的分类方法、贝叶斯分类方法、基于神经网络的分类方法、K-最临近分类方法、基于关联规则的分类方法等。从表上看来,多标签分类和单标签分类具有很大的相似性,两者的目的都是对待测数据所包含的标签进行甄别,单标签分类是多标签分类问题的一个特例。然而多标签分类问题中标签间的关系(如相关性、共现性等)、标签和数据分布的不均衡性等问题将导致现有的面向单标签分类问题的方法并不能直接用来处理多标签分类问题,因而,如何设计出有效的多标签分类方法已成为图像识别领域中的一个研究热点。
目前,常用可用于图像识别的多标签分类方法有ML-KNN、改进的C4.5、Bp-MLL、PT系列、PPT、PPT-n、MMAC、RAKEL、RPC、CLR、INSDIF、MLRW等。ML-KNN是Zhang M.L.等人提出的一种基于KNN的多标签分类方法,该方法通过统计方法得出每个标签的先验概率,当输入一个待测图像数据 时,对标签集中的每个标签分别计算具有标签和不具有标签的概率,进而预测是否具有标签。算法Bp-MLL通过定义针对多标签图像数据的全局优化函数,使得人工神经元网络能够处理多标签数据。PT系列算法试图利用已有的基于单标签的分类方法来解决多标签分类问题,即在训练之前一次性地将训练图像样本数据集中所有包含多个标签的训练数据样本转换成单标签数据,经过相应处理后,算法所面对的训练数据样本集均为单标签样本集,从而将多标签分类问题转化为单标签分类问题。针对PT方法中新标签数量的不可控性,算法PPT、PPT-n、RAKEL提出了一系列处理方法,算法PPT和PPT-n通过阈值的设置来减少新标签的数量,算法RAKEL则是通过随机选择的方式来减少其数量的。算法RPC、CLR则通过对比标签集中任意两个标签之间的关系,建立(- 1) / 2 个分类器,每个分类器在两个标签之间投票,然后组合这些投票结果作为最终的多标签分类结果。
纵观上述这些方法,我们可以将多标签分类问题分为两类,一类是基于算法转化的方法,另一类是基于问题转化的方法。这些方法存在着一些算法本身无法克服的不足,如:改进的C4.5算法采用分而治之的策略所得到的决策树并不一定是最优的,决策树的结构调整、性能改善等也较为困难;算法Bp-MLL存在的问题是该方法不能观察中间的学习过程,最后的输出结果也较难解释,影响了结果的可信度及可接受程度,同时,该方法需要较长的学习时间;ML-KNN在高维数据的分类中,该方法的缺陷也得以凸显。
发明内容
本发明的目的是提供一种一次性对单幅图像包括多个标签的图像进行识别的方法,该方法可以快速的构造候选频繁项目集,实现准确高效的多标签图像识别功能。
本发明的技术方案是:一种基于多标签的图像识别方法,包括候选频繁项目集的构造和图像识别步骤,其特征在于:所述候选频繁项目集的构造和图像识别步骤包括:
步骤1图像样本数据集的准备和预处理,包括训练图像格式转换、尺度归一化、去噪和增强;
步骤2采用基于密度聚类的图像分割方法分别识别出每幅图像样本的待识别区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110313956.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序