[发明专利]一种基于分布式K-means的海量图像分类方法有效

申请号：	201510363396.0	申请日：	2015-06-26
公开（公告）号：	CN104933445B	公开（公告）日：	2019-05-14
发明（设计）人：	董乐;张宁	申请（专利权）人：	电子科技大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	电子科技大学专利中心 51203	代理人：	李明光
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于分布式K‑means的海量图像分类方法，属于机器学习与图像处理技术领域。本发明可用于大规模图像分类，该方法在大数据处理平台Hadoop上采用分布式K‑means算法提取图像特征，最终实现对大规模图像进行分类的目的。本发明通过对大规模图像数据进行字典的学习，构建特征映射函数以及分类算法的设计，提出了在大数据处理平台Hadoop基础上，基于分布式K‑means的特征提取算法。该方法避免了人为设计大规模图像特征的繁琐工作，在保证分类准确度的前提下，减少了训练时间，本发明的成果在大规模数据库管理、军事、医疗等方面有着重要的意义。
搜索关键词：	一种基于分布式 means 海量图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于分布式K‑means的海量图像分类方法，具体包括如下步骤：步骤1.训练图像预处理；输入训练图像数据集，并将每张训练图像划分成多个图像块，对每个图像块依次进行正则化和白化操作以去除干扰信息、保留关键信息，作为输入信息送给下一步处理；步骤2.在大数据处理平台Hadoop上，将K‑means算法并行化，把步骤1所得的预处理后的图像块信息作为输入，进行字典的提取；步骤2所述的字典提取过程具体如下：经过步骤1预处理后的图像块作为Map节点的输入，首先初始化聚类中心，多个Map节点并行的读取预处理后的图像数据，并计算分配到每个聚类中心的元素，之后在Reduce节点上，统计每个类别的所有元素，重新计算新的聚类中心，对比新的聚类中心和之前的聚类中心的变化是否小于设定的阈值，若小于，则迭代结束，输出聚类中心，否则更新聚类中心，重新开始新的一轮迭代过程；步骤3.提取字典后，构建特征映射函数，将预处理后的训练图像块映射为新的特征表达；步骤3具体过程如下：将步骤2得到的字典并行化的分配给多个Map节点，同时输入新的无标签的图像数据集给每个Map节点，对Map节点上的图像数据集进行特征学习，将输入图像数据进行特征映射得到的特征，公式如下：其中，f⁽ⁱ⁾(x)是图像块的新的特征表达，N是步骤2所提取字典的聚类中心总数，c^(k)是第k个聚类中心；步骤4.将步骤3获得的训练图像块的新的特征表达输入到SVM分类器中，进行图像分类训练；步骤5.针对需要进行分类的目标图像，将其依次进行图像块划分、正则化、白化操作以及特征提取之后，利用完成图像分类训练的SVM分类器进行分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510363396.0/，转载请声明来源钻瓜专利网。

上一篇：一种物品识别和其特征信息显示交互的系统及方法
下一篇：一种基于自编码神经网络的图像聚类方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于分布式K-means的海量图像分类方法有效

专利文献下载