[发明专利]图像分类方法、存储介质和电子设备有效
申请号: | 202111227616.9 | 申请日: | 2021-10-21 |
公开(公告)号: | CN114140637B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 袁建龙;徐渊鸿;王志斌;李昊 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/08 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 存储 介质 电子设备 | ||
1.一种图像分类方法,其特征在于,包括:
获取待分类图像;
采用分类模型对所述待分类图像进行分析,得到分类结果,其中,所述分类模型使用多帧图像以及对所述多帧图像中的每帧图像进行数据增强处理得到的多个视图训练得到,所述多个视图为多个剪切视图,所述多个剪切视图通过对每帧图像对应的整张图像进行数据增强处理得到,所述多个剪切视图中每个剪切视图分别对应所述整张图像中的不同剪切区域,所述多个剪切视图中每个剪切视图对应的剪切对象类别不同,其中,所述分类模型包括:第一神经网络模型和第二神经网络模型;
显示所述分类结果;
其中,通过电子装置提供一图形用户界面,所述图形用户界面所显示的内容至少部分地包含一图像分类场景,采用所述分类模型对所述待分类图像进行分析,得到所述分类结果包括:
在所述图形用户界面内展示多个任务类型;响应作用于所述图形用户界面的触控操作,从所述多个任务类型中确定目标任务类型;在所述图形用户界面内展示所述目标任务类型对应的所述第一神经网络模型;获取目标类型训练集,并采用所述目标类型训练集对所述第一神经网络模型进行模型训练,得到所述目标任务类型对应的所述第二神经网络模型;采用所述第二神经网络模型对所述待分类图像进行分析,得到所述分类结果;
其中,所述方法还包括:
利用初始神经网络模型获取第三视图对应的码本,其中,所述第三视图与预训练图像对应;基于所述码本对第一视图和第二视图进行对比学习,得到对比结果,其中,所述第一视图和所述第二视图通过对所述预训练图像进行数据增强处理得到;通过所述对比结果调整所述初始神经网络模型,得到所述第一神经网络模型。
2.根据权利要求1所述的图像分类方法,其特征在于,采用所述分类模型对所述待分类图像进行分析,得到所述分类结果包括:
采用所述第一神经网络模型对所述待分类图像进行分析,得到所述分类结果,其中,所述第一神经网络模型使用的多组无标签数据中的每组数据包括:预训练图像以及对所述预训练图像进行数据增强处理得到的第一视图和第二视图。
3.根据权利要求1所述的图像分类方法,其特征在于,所述第二神经网络模型采用所述目标类型训练集对所述第一神经网络模型进行训练后得到,所述第一神经网络模型使用的多组无标签数据中的每组数据包括:预训练图像以及对所述预训练图像进行数据增强处理得到的第一视图和第二视图。
4.根据权利要求2或3所述的图像分类方法,其特征在于,所述方法还包括:
对所述预训练图像进行数据增强处理得到的所述第一视图和所述第二视图;
获取所述预训练图像对应的第三视图;
采用所述第一视图、所述第二视图和所述第三视图对初始神经网络模型进行预训练,得到所述第一神经网络模型。
5.根据权利要求1所述的图像分类方法,其特征在于,基于所述码本对所述第一视图和所述第二视图进行对比学习,得到所述对比结果包括:
基于所述码本对所述第一视图进行编码,得到第一编码结果,以及基于所述码本对所述第二视图进行编码,得到第二编码结果;
基于所述码本对所述第一编码结果进行特征提取处理,得到第一特征向量,以及基于所述码本对所述第二编码结果进行特征提取处理,得到第二特征向量;
利用所述第一特征向量和所述第二特征向量得到所述对比结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111227616.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序