[发明专利]图像分类方法、图像分类模型的训练方法及其装置在审
申请号: | 201910672533.7 | 申请日: | 2019-07-24 |
公开(公告)号: | CN112287954A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 黄维然;李傲雪;李震国;罗天歌;王立威 | 申请(专利权)人: | 华为技术有限公司;北京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 孙涛;毛威 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 模型 训练 及其 装置 | ||
本申请涉及人工智能领域中的图像识别技术,提供了图像分类方法、图像分类模型的训练方法及其装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取待处理图像;根据预设的全局类别特征,对所述待处理图像进行分类,得到所述待处理图像的分类结果,其中,所述全局类别特征包括根据训练集中的多个训练图像训练得到的多个类别特征,所述全局类别特征中的多个类别特征用于指示所述训练集中的所有类别的视觉特征,所述训练集中的所有类别为所述训练集中的所有训练图像所属的类别,所述训练集包括基类中的图像和新类中的图像。本申请实施例中的图像分类方法,能够更好地对图像进行分类。
技术领域
本申请涉及人工智能领域,并且更具体地,涉及图像分类方法、图像分类模型的训练方法及其装置。
背景技术
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成象系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。
图像(或图片)的分类是各类图像处理应用的基础,计算机视觉常常会涉及到如何对获取到的图像进行分类的问题。随着机器学习(或深度学习)的迅速发展,机器学习算法在图像分类处理中得到了越来越广泛的应用,同时,也取得了非常好的效果,但是,机器学习算法高度依赖大量标注好的训练数据,而在很多情况下获取数据的非常困难的。
因此,如何在训练数据不足的情况下,更好地对图像进行分类是一个亟需解决的问题。
发明内容
本申请提供图像分类方法、图像分类模型的训练方法及其装置,能够更好地对图像进行分类。
第一方面,提供了一种图像分类方法,该方法包括:获取待处理图像;根据预设的全局类别特征,对所述待处理图像进行分类,得到所述待处理图像的分类结果,其中,所述全局类别特征包括根据训练集中的多个训练图像训练得到的多个类别特征,所述全局类别特征中的多个类别特征用于指示所述训练集中的所有类别的视觉特征,所述训练集中的所有类别为所述训练集中的所有训练图像所属的类别,所述训练集包括基类中的图像和新类中的图像。
上述基类可以理解为大规模训练图像集,上述基类通常包括大量用于模型训练的标注图像,基类中的图像可以为标注图像,这里的标注图像可以指已经标注过该图像所属类别的图像。
相应地,相对于上述基类而言,上述新类中通常包括少量标注样本,新类中的图像也可以为标注图像。也就是说,在本申请实施例中,新类为小样本,即新类中包括少量已经标注所属类别的图像。
例如,基类包括100个类别,每个类别包括1000个(张)训练图像,新类包括5个类别,每个类别包括5个训练图像。
在本申请中,全局类别特征是由训练集中的多个训练图像训练得到的,所述全局类别特征包括能够指示训练集中的所有类别对应的视觉特征的多个类别特征,同时,由于所述全局类别训练过程使用的训练集包括基类中的图像和新类中的图像,可以避免所述全局类别特征过拟合到基类中的图像,从而能够更准确的识别新类中的图像。
可选地,本申请中的图像分类模型,可以基于多阶段训练(episodic training)的策略进行模型训练。例如,可以将模型训练过程分为多个训练阶段(training episode),在每个训练阶段中,可以随机抽取训练集中的几个类别来训练模型,最终,经过多个训练阶段,完成对模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京大学,未经华为技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910672533.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:小口径组织改良复合型人工血管
- 下一篇:一种晶圆卡盘清理装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序