[发明专利]一种图像分类方法和装置、图像检索方法和装置无效
申请号: | 201110444864.9 | 申请日: | 2011-12-27 |
公开(公告)号: | CN103186538A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 贾宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 装置 检索 | ||
1.一种图像分类方法,其特征在于,包括:
提取待分类图像的物理特征;
对该待分类图像进行语义标注,得到相应的标注词;
针对该待分类图像的标注词,将其与语义网络中语义词进行匹配,并依据匹配成功的语义词所对应的语义表征生成语义表征多元组;所述语义网络中存储有语义词和对应的若干语义表征,所述语义表征采用物理特征描述;
将该待分类图像的物理特征和语义表征多元组组成的特征向量输入到图像分类器中,输出相应的分类结果;其中,所述图像分类器为依据各图像类别下的图像样本的物理特征和语义表征多元组组成的特征向量训练得到的分类器,训练和分类过程中语义表征多元组的元数和物理特征相同。
2.如权利要求1所述的方法,其特征在于,所述图像分类器为通过以下步骤获得的分类器:
收集各图像类别下的图像样本,建立训练集;
提取该训练集中各图像样本的物理特征;
对训练集中各图像样本进行语义标注,得到相应的标注词;
针对各图像样本的标注词,将其与语义网络中语义词进行匹配,并依据匹配成功的语义词所对应的语义表征生成语义表征多元组;所述语义网络中存储有语义词和对应的若干语义表征,所述语义表征采用物理特征描述;
依据该训练集中各图像样本的物理特征和语义表征多元组组成的特征向量对该训练集中各图像样本进行训练,得到相应的图像分类器。
3.如权利要求1或2所述的方法,其特征在于,所述依据匹配成功的语义词所对应的语义表征生成语义表征多元组的步骤,包括:
在匹配成功时,在所述语义网络中查询当前语义词所对应的语义表征,并记录该语义表征及对应的查询次数;
选取查询次数最多的前N个语义表征,组成语义表征多元组,N为自然数。
4.如权利要求1或2所述的方法,其特征在于,所述语义表征多元组包括采用颜色描述的颜色语义多元组、采用纹理描述的纹理语义多元组、采用形状描述的形状语义多元组或者采用空间位置描述的空间语义多元组。
5.如权利要求4所述的方法,其特征在于,所述颜色语义多元组的元数为颜色语义三元组。
6.如权利要求5所述的方法,其特征在于,所述颜色语义三元组的第一元表示的主色调包括红、橙、棕、黄、绿、蓝、紫、粉、米黄、洋红和橄榄绿,所述颜色语义三元组的第二元表示的次色调包括红、棕、黄、绿、蓝、紫和粉,所述颜色语义三元组的第三元表示的亮度包括黑、暗、灰、亮和白。
7.如权利要求1或2所述的方法,其特征在于,所述物理特征和语义表征多元组组成的特征向量包括物理特征和字符串形式的语义表征多元组组成的特征向量,或者,物理特征和数字形式的语义表征多元组组成的特征向量,其中,所述数字形式的语义表征多元组为依据字符串形式的语义表征多元组量化得到。
8.一种图像分类装置,其特征在于,包括:
提取模块,用于提取待分类图像的物理特征;
语义标注模块,用于对该待分类图像进行语义标注,得到相应的标注词;
匹配模块,用于针对该待分类图像的标注词,将其与语义网络中语义词进行匹配;
生成模块,用于依据匹配成功的语义词所对应的语义表征生成语义表征多元组;所述语义网络中存储有语义词和对应的若干语义表征,所述语义表征采用物理特征描述;及
分类器分类模块,用于将该待分类图像的物理特征和语义表征多元组组成的特征向量输入到图像分类器中,输出相应的分类结果;其中,所述图像分类器为依据各图像类别下的图像样本的物理特征和语义表征多元组组成的特征向量训练得到的分类器,训练和分类过程中语义表征多元组的元数和物理特征相同。
9.一种图像检索方法,其特征在于,包括:
使用权利要求1至7中任一项所述的方法对图像数据库中图像进行分类,并对该图像数据库中分类后的图像进行添加关键词处理或者抽取内容特征处理;
在接收到用户的文本查询请求时,依据该文本查询请求,在该图像数据库中进行关键词的匹配查询,并将匹配查询得到的相应图像返回给用户;
在接收到用户的图像查询请求时,依据该图像查询请求,在该图像数据库中进行内容特征的匹配查询,并将匹配查询得到的相应图像返回给用户。
10.一种图像检索装置,其特征在于,包括:
图像分类模块,用于使用权利要求8所述的装置对图像数据库中图像进行分类;
关键词处理模块,用于对该图像数据库中分类后的图像进行添加关键词处理;
抽取特征处理模块,用于对该图像数据库中分类后的图像进行抽取内容特征处理;
文本查询处理模块,用于在接收到用户的文本查询请求时,依据该文本查询请求,在该图像数据库中进行关键词的匹配查询,并将匹配查询得到的相应图像返回给用户;及
图像查询处理模块,用于在接收到用户的图像查询请求时,依据该图像查询请求,在该图像数据库中进行内容特征的匹配查询,并将匹配查询得到的相应图像返回给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110444864.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序