[发明专利]一种图像分类方法和装置、图像检索方法和装置无效
申请号: | 201110444864.9 | 申请日: | 2011-12-27 |
公开(公告)号: | CN103186538A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 贾宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 装置 检索 | ||
技术领域
本申请涉及图像信息处理技术领域,特别是涉及一种图像分类方法和装置、一种图像检索方法和装置。
背景技术
目前,随着现代电子计算机技术及网络的迅速发展,庞大的、多样的图像信息不断出现,各行各业对图像的使用越来越广泛,进而推动了图像信息处理的进一步发展。现有的图像广泛地分布在互联网上,缺少有效的组织,难以达到资源共享的目的。因此,如何从如此众多的图像信息中找到自己所需要的信息,是对图像信息处理技术提出的重大挑战。
图像分类方法是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法,它能够利用计算机对互联网上的大量图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。图像分类系统就是将一幅输入图像归到预置的类别,例如,用户向图像分类系统提交一幅图像,图像分类系统就会将其分到一个已知类别下并将结果返回给用户。
现有的图像分类方法大多基于图像的内容如颜色、形状、纹理和空间位置等图像的物理特征来对图像进行分类,其能够提供有效的分类手段,但由于其在处理图像特征上几乎完全依赖图像的物理特征,而物理特征所描述的图像信息有限,因此在分类结果中难免会出现准确性不足的问题。例如,一幅包含一匹红色的侧面马的图像和一幅包含一匹白色的正面马的图像,由于二者的物理特征(颜色、形状和纹理等)差距极大,因此,单纯地依赖物理特征,很容易将二者归到不同的类别中,而实际上二者均隶属于“马”类,这出现了不准确的分类结果。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提高图像分类的准确性。
发明内容
本申请提供一种图像分类方法和装置,以提高图像分类的准确性。
本申请还提供一种图像检索方法和装置,以提高图像检索结果的准确性,更加准确地为用户从众多的图像信息中找到自己所需要的信息。
为了解决上述问题,本申请公开了一种图像分类方法,包括:
提取待分类图像的物理特征;
对该待分类图像进行语义标注,得到相应的标注词;
针对该待分类图像的标注词,将其与语义网络中语义词进行匹配,并依据匹配成功的语义词所对应的语义表征生成语义表征多元组;所述语义网络中存储有语义词和对应的若干语义表征,所述语义表征采用物理特征描述;
将该待分类图像的物理特征和语义表征多元组组成的特征向量输入到图像分类器中,输出相应的分类结果;其中,所述图像分类器为依据各图像类别下的图像样本的物理特征和语义表征多元组组成的特征向量训练得到的分类器,训练和分类过程中语义表征多元组的元数和物理特征相同。
优选的,所述图像分类器为通过以下步骤获得的分类器:
收集各图像类别下的图像样本,建立训练集;
提取该训练集中各图像样本的物理特征;
对训练集中各图像样本进行语义标注,得到相应的标注词;
针对各图像样本的标注词,将其与语义网络中语义词进行匹配,并依据匹配成功的语义词所对应的语义表征生成语义表征多元组;所述语义网络中存储有语义词和对应的若干语义表征,所述语义表征采用物理特征描述;
依据该训练集中各图像样本的物理特征和语义表征多元组组成的特征向量对该训练集中各图像样本进行训练,得到相应的图像分类器。
优选的,所述依据匹配成功的语义词所对应的语义表征生成语义表征多元组的步骤,包括:
在匹配成功时,在所述语义网络中查询当前语义词所对应的语义表征,并记录该语义表征及对应的查询次数;
选取查询次数最多的前N个语义表征,组成语义表征多元组,N为自然数。
优选的,所述语义表征多元组包括采用颜色描述的颜色语义多元组、采用纹理描述的纹理语义多元组、采用形状描述的形状语义多元组或者采用空间位置描述的空间语义多元组。
优选的,所述颜色语义多元组的元数为颜色语义三元组。
优选的,所述颜色语义三元组的第一元表示的主色调包括红、橙、棕、黄、绿、蓝、紫、粉、米黄、洋红和橄榄绿,所述颜色语义三元组的第二元表示的次色调包括红、棕、黄、绿、蓝、紫和粉,所述颜色语义三元组的第三元表示的亮度包括黑、暗、灰、亮和白。
优选的,所述物理特征和语义表征多元组组成的特征向量包括物理特征和字符串形式的语义表征多元组组成的特征向量,或者,物理特征和数字形式的语义表征多元组组成的特征向量,其中,所述数字形式的语义表征多元组为依据字符串形式的语义表征多元组量化得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110444864.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序