[发明专利]一种图像的分类方法及系统在审

专利信息
申请号: 201910925538.6 申请日: 2019-09-27
公开(公告)号: CN110751191A 公开(公告)日: 2020-02-04
发明(设计)人: 刘学文 申请(专利权)人: 广东浪潮大数据研究有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 11227 北京集佳知识产权代理有限公司 代理人: 郭化雨
地址: 510620 广东省广州市天河区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 编码器 标签图像 聚类算法 人工分类 有效特征 聚类簇 测试图像 图像特征 聚类 提取图像特征 类别定义 数据分布 图像分类 图像输入 隐藏层 分类 准确率 维度 申请 标签 图像
【说明书】:

本申请公开了一种图像的分类方法及系统,包括:将具有人工分类标签的图像输入自编码器中对自编码器进行训练;将测试图像输入训练后的自编码器中;将自编码器中维度最少的隐藏层确定为有效特征层;利用谱聚类算法对有效特征层进行聚类,根据有效特征层提取的图像特征将所有测试图像分为多个聚类簇;在每个聚类簇中,获取不同类别的人工分类标签图像的数量,利用数量最多的人工分类标签图像的类别定义当前聚类簇中无标签图像的类别。由此可见,本申请采用自编码器提取图像特征,利用谱聚类算法进行分类,得到的图像特征更为准确,并且谱聚类算法对于数据分布的适应能力更强,聚类效果也更加明显,对图像分类的准确率更高。

技术领域

本申请涉及图像处理领域,尤其涉及一种图像的分类方法及系统。

背景技术

在图像分类场景中,常常使用监督学习的方法训练神经网络。其中,监督学习是指使用全部已经标记过的图像对神经网络进行训练的方式。神经网络通过已标记的图像的训练后就可以得到标记所对应的图像特征,并且可以根据训练得到的特征对新的未标记的图像进行特征提取与分类。但是生活中被标记过的图像较少,而对未标记的图像进行提前人工标记则需要耗费大量的时间和资源,并不利于神经网络的训练。

为了减少训练中所需标记图像的数量,现有技术中采用半监督学习方法,使用小部分已标记的和大部分未标记的图像对神经网络进行训练。但是,由于采用的图像的特征提取算法以及分类算法存在着特征提取不准确,计算量大等问题,导致在半监督图像分类中存在着准确率不高的问题。

发明内容

为了解决现有技术存在的上述技术问题,本申请提供一种图像的分类方法及系统,可以通过自编码器提取图像特征以及谱聚类算法对图像进行分类,提高半监督图像分类的准确率。

第一方面,本申请实施例提供一种图像分类方法,包括:

将具有人工分类标签的图像输入自编码器中对自编码器进行训练,当自编码器输出的图像与输入的原图像的特征近似度满足预设要求时,结束对自编码器的训练;其中,自编码器是一种输入维度等于输出维度,通过减少中间隐藏层的维度来提取图像特征的网络结构;

将测试图像输入训练后的自编码器中;其中,测试图像为具有人工分类标签的图像和待分类的无标签图像;

将自编码器中维度最少、所提取的图像特征具有代表图像类别意义的隐藏层确定为有效特征层;

利用谱聚类算法对有效特征层进行聚类,根据有效特征层提取的图像特征将所有测试图像分为多个聚类簇;

在每个聚类簇中,获取不同类别的人工分类标签图像的数量,利用数量最多的人工分类标签图像的类别定义当前聚类簇中无标签图像的类别。

可选的,所述将具有人工分类标签的图像输入自编码器中对自编码器进行训练,包括:将添加噪声后的具有人工分类标签的图像输入自编码器中对自编码器进行训练。

可选的,所述聚类簇的个数为:与需要得到的图像分类的种类个数一致。

可选的,所述具有人工分类标签的图像包括:至少包括无标签图像所要进行分类确定的分类标签的人工分类标签图像。

可选的,所述对自编码器进行训练,包括:使用均方误差函数作为损失函数以及Adam优化器对自编码器进行训练。

可选的,所述方法还包括:若聚类簇中出现不同种类的人工分类标签图像的数量相同或者相近,重新进行自编码器的训练以及测试图像的分类。

第二方面,本申请实施例提供一种图像分类系统,所述系统包括:

训练单元,用于将具有人工分类标签的图像输入自编码器中对自编码器进行训练,当自编码器输出的图像与输入的原图像的特征近似度满足预设要求时,结束对自编码器的训练,将测试图像输入训练后的自编码器中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东浪潮大数据研究有限公司,未经广东浪潮大数据研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910925538.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top