[发明专利]图像分类方法、装置、设备及存储介质有效
申请号: | 202110723873.5 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113177616B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 李悦翔;何楠君;马锴;郑冶枫 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 装置 设备 存储 介质 | ||
本申请公开了一种图像分类方法、装置、设备及存储介质。包括:对第一样本图像进行图像分割,并对分割得到的各个图像块进行特征提取,得到初始图像特征集合,初始图像特征集合中包含各个图像块对应的初始图像特征,第一样本图像是未经过标注的样本图像;对初始图像特征集合中的初始图像特征进行重排组合,得到第一图像特征集合和第二图像特征集合,第一图像特征集合中的第一图像特征与第二图像特征集合中的第二图像特征对应不同重排组合方式;基于第一图像特征集合和第二图像特征集合预训练图像分类模型,图像分类模型用于对图像中的内容进行分类;基于第二样本图像对预训练后的图像分类模型进行微调,第二样本图像是经过标注的样本图像。
技术领域
本申请实施例涉及人工智能领域,特别涉及一种图像分类方法、装置、设备及存储介质。
背景技术
图像分类是指根据图像的语义信息对不同类别图像进行区分的过程。
相关技术中,采用Vision Transformer(ViT)模型对输入图像进行分类,在对该模型训练过程中,输入大量经过标注的样本图像,进而基于模型预测的分类结果与标签间差异训练该模型,实现ViT模型对图像的精确分类。
然而,在训练过程中,若经过标注的样本图像较少,则ViT模型训练效果较差,影响图像分类准确性。
发明内容
本申请实施例提供了一种图像分类方法、装置、设备及存储介质,可以减少图像分类模型训练过程中对经过标注的样本图像的需求,且有助于提高图像分类模型预测结果的准确性。所述技术方案包括如下内容。
一方面,本申请实施例提供了一种图像分类方法,所述方法包括如下内容:
对第一样本图像进行图像分割,并对分割得到的各个图像块进行特征提取,得到初始图像特征集合,所述初始图像特征集合中包含各个图像块对应的初始图像特征,所述第一样本图像是未经过标注的样本图像;
对所述初始图像特征集合中的所述初始图像特征进行重排组合,得到第一图像特征集合和第二图像特征集合,所述第一图像特征集合中的第一图像特征与所述第二图像特征集合中的第二图像特征对应不同重排组合方式;
基于所述第一图像特征集合和所述第二图像特征集合预训练图像分类模型,所述图像分类模型用于对图像中的内容进行分类;
基于第二样本图像对预训练后的所述图像分类模型进行微调,所述第二样本图像是经过标注的样本图像。
另一方面,本申请实施例提供了一种图像分类装置,所述装置包括如下模块:
图像分割模块,用于对第一样本图像进行图像分割,并对分割得到的各个图像块进行特征提取,得到初始图像特征集合,所述初始图像特征集合中包含各个图像块对应的初始图像特征,所述第一样本图像是未经过标注的样本图像;
第一重排组合模块,用于对所述初始图像特征集合中的所述初始图像特征进行重排组合,得到第一图像特征集合和第二图像特征集合,所述第一图像特征集合中的第一图像特征与所述第二图像特征集合中的第二图像特征对应不同重排组合方式;
第一预训练模块,用于基于所述第一图像特征集合和所述第二图像特征集合预训练图像分类模型,所述图像分类模型用于对图像中的内容进行分类;
微调模块,用于基于第二样本图像对预训练后的所述图像分类模型进行微调,所述第二样本图像是经过标注的样本图像。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的图像分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110723873.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序