[发明专利]一种基于多尺度全局特征和局部特征的图像分类方法有效
申请号: | 201510186133.7 | 申请日: | 2015-04-17 |
公开(公告)号: | CN104766096B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 路通;秦龙飞;梁国柱 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 江苏圣典律师事务所32237 | 代理人: | 胡建华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 全局 特征 局部 图像 分类 方法 | ||
技术领域
本发明涉及计算机图像分类方法,特别是一种基于多尺度全局特征和局部特征的图像分类方法。
背景技术
图像分类一直是计算机图像领域的一个基本问题,特别是随着互联网的急速发展,大量的无分类的图像出现在网络中,给图像的快速检索及建立在分类之上的应用带来了极大挑战。
目前为止,常见的图像分类技术包括基于色彩特征的分类技术,基于纹理特征的分类技术,基于形状特征的分类技术和基于空间关系的分类技术。基于色彩特征的分类技术假设每种物体都有其特有的色彩特征,由于颜色直方图具有简单且对旋转和缩放不敏感等特征,得到了广泛的关注;基于纹理的图像分类技术,经历了从灰度共生矩阵到小波变换的过程,达到了一定分类效果;基于形状分析的图像分类技术大多围绕着形状的轮廓特征和形状的区域特征,更常用的办法是采用区域特征和边界特征相结合的形式进行形状相似性分析;基于空间关系的图像分类技术,由于利用图像中对象间的位置空间关系区别图像,符合人们识别图像的习惯,所以近些年许多研究人员从图像中对象空间位置关系出发着手分析,虽然起到过一定作用,但由于它们都是采用对象的最小外接矩形来表示一个对象空间位置,这对于矩形对象来说是比较合适的,但是当两个对象是不规则形状,且它们在空间关系上是分离时,它们的外接矩形却存在着某种包含和交叠,结果出现对这些对象空间关系的错误表示。
虽然目前图像分类的方法很多,但大多没有考虑图像中的文本特征对分类起到的作用。同时,对整个图像提取特征不但不是必须的而且需要花费大量计算时间。
发明内容
发明目的:本发明所要解决的问题是针对目前图像分类技术的不足,提供一种基于多尺度全局特征和局部特征的图像分类方法,特别是利用图像中的文本信息提取有效显著区域并计算显著区域中的颜色特征和空间分布特征,利用小波图像金字塔得到多尺度全局特征,利用四分树算法得到局部特征,最后结合多尺度全局特征和局部特征对图像进行分类。
为了解决上述问题,本发明公开了一种基于多尺度全局特征和局部特征的图像分类方法,包括以下步骤:
将待分类图像数据库中的每张原始图像I作为输入,执行步骤1~步骤11:
步骤1:利用MATLAB软件提供的小波图像金字塔算法输入原始图像I,输出五种不同尺度的图像,每种尺度的图像作为下一步的输入图像,执行步骤2~步骤9;五种不同尺度的图像处理完毕后执行步骤10;
步骤2:计算输入图像的灰度图像。其中输入图像属于RGB颜色空间,每个像素由红,绿,蓝三个颜色值决定,每种颜色取值范围0~255。计算后的灰度图像每个像素由一个灰度值决定,灰度值取值范围0~255;
步骤3:利用MATLAB软件提供的Canny边缘和Sobel边缘计算方法,计算灰度图像的Canny边缘图像和Sobel边缘图像。其中,Canny边缘图像和Sobel边缘图像都属于二值图像,每个像素取值0或1;
步骤4:分别计算Canny边缘图像的特征向量场和Sobel边缘图像的特征向量场。计算得到的特征向量场在每个像素处,其值为一个向量,表示该像素处场值的大小和方向;
步骤5:分别计算Canny特征向量场的显著区域和Sobel特征向量场的显著区域。其中,显著区域表现为二值图像,像素值为0表示该像素不属于显著区域,像素值为1表示该像素属于显著区域;
步骤6:计算Canny显著区域和Sobel显著区域的交集,得到这两种显著区域的重合区域,过滤后作为最终显著区域;
步骤7:提取最终显著区域的空间分布特征;
步骤8:根据最终显著区域,保留其对应位置处输入图像的像素值,提取这些像素值的颜色特征。颜色特征包括RGB颜色特征,HSV颜色特征和灰度颜色特征;
步骤9:合并步骤7得到的空间分布特征和步骤8得到的颜色特征,得到原始图像的全局特征。
步骤10:将原始图像I用四分树算法四等分为四个区域,每一个区域作为输入图像,执行步骤2~步骤8,得到输入图像的空间分布特征和颜色特征,合并空间分布特征和颜色特征,得到原始图像的局部特征;
步骤11:整合步骤9和步骤10得到的原始图像的全局特征和局部特征,作为图像的分类特征;
步骤12:选择逻辑回归分类器,对数据库中的图像进行分类。
本发明步骤4中,计算Canny边缘图像的特征向量场和Sobel边缘图像的特征向量场包括以下步骤,定义能量函数ε,通过最小化能量函数ε计算Canny边缘图像的特征向量场gCanny:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510186133.7/2.html,转载请声明来源钻瓜专利网。