[发明专利]一种基于注意力关系图学习的图像分类方法及装置在审
申请号: | 201910564976.4 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110263874A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 袭肖明;于治楼;姜凯 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 冯春连 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力 分类结果 学习 构建 神经网络模型 分类 采集图像 图像分类 度量 映射 图像 图像处理技术 图像分类装置 获取图像 神经网络 有效目标 引入 | ||
本发明公开一种基于注意力关系图学习的图像分类方法,涉及图像处理技术领域,包括训练部分和分类部分;在训练部分,首先采集图像,随后通过引入注意力映射学习模型和最大区间近邻度量学习方法完成注意力关系图的构建,随后将注意力关系图输入图卷积神经网络进行处理后获得分类结果,最后,通过学习注意力关系图和分类结果构建图卷积神经网络模型;在分类部分,采集图像后,利用注意力映射学习模型和最大区间近邻度量学习方法构建图像的注意力关系图,最后将注意力关系图输入图卷积神经网络模型,得出分类结果。本发明还提供一种基于注意力关系图学习的图像分类装置,其与前述分类方法相结合,通过获取图像的有效目标完成图像的分类。
技术领域
本发明涉及图像处理技术领域,具体的说是一种基于注意力关系图学习的图像分类方法及装置。
背景技术
图像分类是图像处理、计算机视觉等领域的重要组成部分。然而在某些任务中,由于分类模型忽略了主要目标的有效信息,降低了图像的分类精度。针对现有分类方法忽略目标有效信息问题。因此,如何有效解决目标有效信息的提取及利用问题对于图像分类,具有重要的研究意义和应用价值。
发明内容
本发明针对现有分类模型因忽略了主要目标的有效信息而降低图像分类精度的问题,提供一种基于注意力关系图学习的图像分类方法及装置。
首先,本发明公开一种基于注意力关系图学习的图像分类方法,解决上述技术问题采用的技术方案如下:
一种基于注意力关系图学习的图像分类方法,该分类方法包括:
(一)训练部分:
步骤一、采集图像,所采集图像作为样本图像;
步骤二、引入注意力映射学习模型,学习图像中能够引起人注意的区域信息,获取该图像的注意力映射;
步骤三、引入最大区间近邻度量学习方法,基于注意力映射学习模型获取图像的注意力映射,构建注意力关系图;
步骤四、将注意力关系图输入图卷积神经网络进行处理,获得分类结果;
步骤五、循环执行步骤一至步骤四,学习同一张图像的注意力关系图和分类结果,在图卷积神经网络的基础上训练并构建图卷积神经网络模型;
(二)分类部分:
步骤一、采集图像,所采集图像作为待分类图像;
步骤二、将图像输入注意力映射学习模型,获取该图像的注意力映射;
步骤三、基于注意力映射学习模型获取图像的注意力映射,通过最大区间近邻度量学习方法构建注意力关系图;
步骤四、将注意力关系图输入图卷积神经网络模型,获得分类结果。
具体的,所涉及注意力映射学习模型采用U-net模型作为基础模型。
可选的,通过最大区间近邻度量学习方法构建注意力关系图的具体操作包括:
1)将图像的每个像素作为图的节点,构造图的节点;
2)提取每个像素点的灰度、空间及邻域平均灰度信息作为每个像素点的特征。;
3)基于最大间隔近邻度量学习方法,学习一个马氏度量空间,该空间是基于现有数据学习出来的最优相似度度量空间;
4)学习马氏度量空间后,可以获取像素之间的相关性信息;
5)马氏度量空间计算出来的距离即为两两像素之间的相似度,基于像素之间的相似度和设定阈值,构建图中任意两个节点的边,从而完成度量关系图的构建。
具体的,所涉及图卷积神经网络模型包含1*1的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910564976.4/2.html,转载请声明来源钻瓜专利网。