[发明专利]基于图卷积的多标签图像分类方法、装置及设备有效

专利信息
申请号: 201910051706.3 申请日: 2019-01-18
公开(公告)号: CN109816009B 公开(公告)日: 2021-08-10
发明(设计)人: 魏秀参;陈钊民 申请(专利权)人: 南京旷云科技有限公司;徐州旷视数据科技有限公司;北京旷视科技有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 黄彩荣
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图卷 标签 图像 分类 方法 装置 设备
【说明书】:

发明提供了一种基于图卷积的多标签图像分类方法、装置及设备,涉及智能识别技术领域,该方法包括:获取待分类的图像;对待分类的图像进行特征提取,得到图像特征信息;将图像特征信息输入预先训练的多标签分类器;多标签分类器是由图卷积网络进行多标签关系建模,并学习得到的包括多标签关系信息的分类器;根据多标签分类器输出的至少一个标签分数,确定待分类图像对应的标签。本发明实施例提供的多标签图像分类方法、装置及设备可以提高图像分类精度。

技术领域

本发明涉及智能识别技术领域,尤其是涉及一种基于图卷积的多标签图像分类方法、装置及设备。

背景技术

由于在自然场景下,图像总是包含了多个标签,因此多标签的图像分类问题相比单标签更具有实际意义,多标签的图像分类(Multi-label image classification)的目的是为了把图像中所有物体都预测出来。由于图像包含多个标签,分类的结果组合数目相比单标签是指数级别的增长,相比于单标签图像分类问题来说,多标签图像分类问题难度更大、精度更低。

现有方法包括使用图(Graph)来建模标签之间的关系,以此来人为的给最后预测的结果加上约束,以便减少分类结果的数目。由于这种方法非常取决于人的先验知识和所建图的好坏,具有很大的局限性。由于深度学习(Deep Learning)的快速发展,人们现在开始利用深度学习的方法来解决多标签图像分类问题。目前使用深度学习来解决多标签分类问题主要分为两类:1.基于图模型的方法,主要使用循环神经网络(Recurrent NeuralNetwork,RNN)来建模图,非常依赖于输入标签的顺序,且由于RNN长度限制导致不灵活;2.基于注意力(Attention)机制,只建模了局部图片标签的关系而非全局关系。

发明内容

有鉴于此,本发明的目的在于提供一种基于图卷积的多标签图像分类方法、装置及设备,可以提高分类精度。

为了实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供了一种基于图卷积的多标签图像分类方法,包括:获取待分类的图像;对所述待分类的图像进行特征提取,得到图像特征信息;将所述图像特征信息输入预先训练的多标签分类器;所述多标签分类器是由图卷积网络进行多标签关系建模,并训练得到的包括多标签关系信息的分类器;根据所述多标签分类器输出的至少一个标签分数,确定所述待分类图像对应的标签。

进一步,所述多标签分类器的训练过程包括:将每个标签表示为一个词嵌入向量,并将所述词嵌入向量和邻接矩阵输入图卷积网络,确定所述图卷积网络每层卷积层的映射函数;所述映射函数的输入为前一卷积层的特征描述子和所述邻接矩阵,输出为后一卷积层的特征描述子;其中所述邻接矩阵通过以下步骤确定:统计训练集中标签两两之间同时出现的次数,以及标签的总数量;根据所述次数和所述总数量确定所述训练集的概率矩阵;将所述概率矩阵作为所述邻接矩阵。

进一步,所述方法还包括:将所述概率矩阵转换成二值矩阵,并将所述转换成二值矩阵通过重新分配权重策略转换为重新分配权重之后的关系矩阵;将所述重新分配权重之后的关系矩阵作为邻接矩阵。

进一步,所述图像特征信息为所述待分类的图像对应的图像描述子;所述根据所述多标签分类器输出的至少一个标签分数的步骤,包括:将所述多标签分类器的输出矩阵与所述图像描述子做点积,得到至少一个标签分数。

进一步,所述图卷积网络包括的映射函数如下:

Hl+1=f(Hl,A)

其中,特征描述子Hl和邻接矩阵A作为输入,特征描述子Hl+1作为输出,l表示卷积层的层数。

进一步,所述图卷积网络包括的映射函数如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京旷云科技有限公司;徐州旷视数据科技有限公司;北京旷视科技有限公司,未经南京旷云科技有限公司;徐州旷视数据科技有限公司;北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910051706.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top