[发明专利]一种基于MapReduce的图像分类方法在审
申请号: | 201410673349.1 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104392250A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 黄敏;刘晶;杨晋博 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/46 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 张靖 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mapreduce 图像 分类 方法 | ||
1.一种基于 MapReduce 的图像分类方法,其特征在于:在 Hadoop 平台上,图像分类过程主要分为两个阶段:
第一阶段是将图像转换为稀疏矩阵;
首先,利用 MapReduce 框架实现对图像 SIFT特征的并行提取;然后,利用 MapReduce 框架对每幅图像提取的 SIFT 特征进行稀疏编码,从而获得图像对应的稀疏向量,生成图像的稀疏特征;
第二阶段是利用随机森林方法实现对图像集的并行分类;
首先基于图像的稀疏特征,利用 MapReduce 框架训练决策树,生成针对图像特征集合的随机森林;然后,利用MapReduce 结合随机森林对每幅图像进行分类计算。
2.根据权利要求1所述的一种基于 MapReduce 的图像分类方法,其特征在于:所述方法涉及的设计结构包括:1)MapReduce 编程模型、2)稀疏编码模型、3)随机森林图像分类算法,其中:
1)MapReduce 编程模型:MapReduce 能够将工作流分配到大规模计算机集群上,其过程是首先将任务和数据分发到集群的节点之上,然后各个节点并行地执行任务,得到中间结果之后进行汇集并再次分发计算,并得到最终结果;
2)稀疏编码模型:在对图像进行分类时,能够提取每幅图像的 SIFT 特征,由于每幅图像之间是相互独立的,其特征提取过程能够并行地进行,稀疏编码是通过一些已训练的能够表示低层特征的基向量进行线性组合实行对图像特征的表示,为提高图像分类的准确率,利用稀疏编码方法生成了基于 SIFT 特征描述子的稀疏向量;
3)随机森林图像分类算法:随机森林由一组决策树组成, 每棵决策树充当一个分类器,最终的预测结果由这些决策树进行综合投票,从中选择获得最多票数的类别作为输出结果。
3.根据权利要求1或2所述的一种基于 MapReduce 的图像分类方法,其特征在于,基于 MapReduce 的 SIFT 特征提取步骤如下:
步骤 1 将全体图像集合作为 MapReduce 作业的输入,把每个图像作为一个输入分片;
步骤 2 Map 函数执行并行的特征提取;Map 函数的输入为键/值对〈Key,Value〉,其中 Key 为文件名,Value 为图像数据,在函数中对图像进行运算,提取图像的 SIFT 特征;Map 函数的输出为键/值对 〈Key,Value〉,其中 Key 为文件名,Value 为表示 SIFT 特征的数组,数组每个元素也为键 /值对,在此用 〈K,V〉表示,其中 K 为特征点位置坐标(x,y),V为特征点对应的 128 维特征向量。
4.根据权利要求1或2所述的一种基于 MapReduce 的图像分类方法,其特征在于,将稀疏编码过程通过 MapReduce 进行分布式处理的步骤如下:
步骤 1 将全体 SIFT 特征集合作为 MapReduce 作业的输入,把每幅图像的 SIFT 特征集合按照空间位置平均划分为n 个格子,第 i 个格子中的 SIFT 特征集合表示为Fi,将其作为输入分片;
步骤 2 在 Map 函数中并行计算每幅图像中各个格子的稀疏向量,Map 函数的输入为键/值对〈Key,Value〉 ,其中 Key 为文件名,Value 为 SIFT 特征集合Fi,对于任一SIFT特征向量f∈Fi,按照公式f≈Dα,求解稀疏向量αij; 对得到所有稀疏向量αij进行比较,从中选取绝对值最大的稀疏向量作为该格子的稀疏向量αi ;Map函数的输出为键/值对〈Key ,〈K,V〉〉 ,其中Key为文件名,而Value为一个键/值对〈K,V〉 ,其中K为该格子在原始图像中位置,V 是稀疏向量αi ;
步骤 3 在Reduce 函数中计算整幅图像的稀疏向量,Reduce 函数的输入为 Map 函数输出的键/值对〈Key,Value〉 ;按照稀疏向量对应的区域位置,生成整幅图像的稀疏向量α= {α1,α2 ,…,αn};Reduce 函数的输出为键/值对 〈Key,Value〉 ,其中 Key 为文件名,而 Value 为稀疏向量 α。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410673349.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序