[发明专利]图像分类方法、神经网络的训练方法及装置在审

专利信息
申请号: 201910464523.4 申请日: 2019-05-30
公开(公告)号: CN110309856A 公开(公告)日: 2019-10-08
发明(设计)人: 黄维然;李傲雪;李震国;罗天歌;钱莉;王立威 申请(专利权)人: 华为技术有限公司;北京大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 北京龙双利达知识产权代理有限公司 11329 代理人: 张振;张欣
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 待处理图像 神经网络模型 图像分类 训练图像 神经网络 特征图 卷积 计算机视觉领域 人工智能领域 类层次结构 处理图像 分类结果 卷积处理 分类 申请 标签 图像
【说明书】:

本申请提供了图像分类方法、神经网络的训练方法及装置。涉及人工智能领域,具体涉及计算机视觉领域。其中,该图像分类方法包括:获取处理图像;根据预先训练好的神经网络模型对该待处理图像进行卷积处理,得到待处理图像的卷积特征图,并根据该待处理图像的卷积特征图对该待处理图像进行分类,得到该待处理图像的分类结果。由于神经网络模型在训练时不仅采用了多个训练图像的标签,还采用了多个训练图像的类层次结构信息,神经网络模型在训练时利用了训练图像更丰富的信息,因此,本申请能够更好地对图像进行分类。

技术领域

本申请涉及人工智能领域,并且更具体地,涉及一种图像分类方法、神经网络的训练方法和装置。

背景技术

计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成像系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。

计算机视觉常常会涉及到如何对获取到的图像或者图片进行分类的问题。对图像进行分类也得到了越来越广泛的应用,因此,如何更好的对图像进行分类是一个需要解决的问题。

发明内容

本申请提供一种图像分类方法、神经网络的训练方法及装置,以更好地进行图像分类。

第一方面,提供了一种图像分类方法,该方法包括:获取待处理图像;根据预设的神经网络模型对待处理图像进行分类,得到待处理图像的分类结果。

其中,上述待处理图像的分类结果包括待处理图像所属的类或超类。上述神经网络模型是根据多个训练图像、多个训练图像中的每个训练图像的标签以及多个训练图像的类层次结构信息训练得到的,上述多个训练图像的类层次结构信息包括多个类中的每个类所属的至少一个超类,该多个类包括多个训练图像中的每个训练图像所属的类。

应理解,上述多个训练图像的类层次结构信息不仅包括多个训练图像中的每个训练图像所属的类,还包括多个训练图像中的每个训练图像所属的至少一个超类,其中,每个训练图像所属的至少一个超类是指每个训练图像的类(每个训练图像所属的类)所属的至少一个超类。

上述每个训练图像的标签包括该每个训练图像所属的类。

上述每个图像所属的类可以理解为图像的普通分类,可以认为是图像的比较基础的分类,是属于图像中物体本身所属的类别,一般不会在该分类的基础上继续向下对图像进行更细的分类。而图像的类所属的超类相当于图像中的物体本身所属的类别的父类,超类是在类之上的更高层次的分类。超类可以相当于父类,一般情况下,可以将具有某些共同特点的图像的类别划分到一个超类中,另外,超类还可以称为大类。

例如,上述多个训练图像包括训练图像1至训练图像4,其中,训练图像1为苹果的图像,训练图像2为橘子的图像,训练图像3为狮子的图像,训练图像4为老虎的图像,那么,训练图像1至训练图像4所属的类分别是苹果、橘子、狮子和老虎。

再如,上述多个训练图像仍包括训练图像1至训练图像4,训练图像1至训练图像4所属的类分别是苹果、橘子、狮子和老虎,那么,训练图像1至训练图像4的类层次结构信息包括:苹果和橘子属于水果,狮子和老虎属于动物。根据训练图像1至训练图像4的类层次结构信息,能够得知苹果和橘子所属的超类为水果,狮子和老虎所属的超类为动物。

可选地,上述至少一个超类包括不同层次的超类,其中,层次高的超类也是层次低的超类的超类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京大学,未经华为技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910464523.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top