[发明专利]基于注意力机制的图像识别分类方法及装置在审
申请号: | 202010005582.8 | 申请日: | 2020-01-03 |
公开(公告)号: | CN111242183A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 张顺利;林贝贝 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 邹芳德 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 图像 识别 分类 方法 装置 | ||
本发明提供了一种基于注意力机制的图像识别分类方法及装置。方法包括:基于卷积神经网络和注意力机制构建图像特征提取模型;采用所述图像特征提取模型提取目标图像的图像特征;根据所述图像特征对目标图像进行识别分类确定所述目标图像的类别。本发明能够提高提取目标图像的图像特征的准确性,进而能够图像分别识别的准确性和精度。
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于注意力机制的图像识别分类方法及装置。
背景技术
随着信息技术的发展,图像数据急剧增长,对图像处理的需求也大大增减。图像的识别分类主要是针对图像中特定特征进行提取,通过特定特征表征图像的信息,然后根据提取到的特定特征进行图形的识别分类。图像识别可以用于诸多领域,并且图像识别可以在各种复杂的条件下快速准确的提取物体的特征,具有广泛的应用前景。
一个典型的图像识别分类系统主要包括两个部分,图像特征提取和基于提取的图像特征的识别分类。在进行图像特征建模时,首先,需要收集大量的图像样本数据,以此为基础构建图像识别数据库,通过图像识别数据库可以训练出一个适用于提取图像特征的模型。然后,基于图像特征提取模型的提取结果,利用相应的识别分类模型,就可以得到图像的识别分类的结果。
目前,图像特征提取模型多采用二维卷积模型,但是卷积网络中对图像特征的处理是等价,例如:识别图像中的动物时,我们更希望卷积网络能够“注意”动物本身,而不是等价的关注动物与背景。因此现有的图像特征提取均存在特征提取不准确的问题,进而导致图像识别分类准确性的降低。
发明内容
针对现有技术中的问题,本发明提供一种基于注意力机制的图像识别分类方法及装置,能够提高图像识别分类的准确性。
为实现上述目的,本发明提供以下技术方案:
一方面,本发明提供了一种基于注意力机制的图像识别分类方法,包括:
基于卷积神经网络和注意力机制构建图像特征提取模型;
采用所述图像特征提取模型提取目标图像的图像特征;
根据所述图像特征对目标图像进行识别分类确定所述目标图像的类别。
其中,所述基于卷积神经网络和注意力机制构建图像特征提取模型,包括:
基于样本训练集和样本训练集对应的标签,采用卷积神经网络进行训练得到卷积网络模型;
通过注意力机制确定所述卷积网络模型的权重并得到第二卷积网络模型;
基于样本训练集和样本训练集对应的标签,对所述第二卷积网络模型进行训练得到图像特征提取模型。
其中,所述基于样本训练集和样本训练集对应的标签,采用卷积神经网络进行训练得到卷积网络模型,包括:
对所述样本训练集进行预处理,生成大小为N1*N2*C的目标训练样本;
采用卷积神经网络中迭代优化的方式对所述目标训练样本和所述标签进行训练,得到卷积网络模型;
其中,N1和N2分别表示输入卷积神经网络的样本的高度和宽度,C表示输入样本是RGB三通道的图片。
其中,所述通过注意力机制确定所述卷积网络模型的权重并得到第二卷积网络模型,包括:
采用注意力机制确定所述卷积网络模型的权重,并所述权重与所述卷积网络模型相乘得到所述第二卷积网络模型。
另一方面,本发明还提供了一种基于注意力机制的图像识别分类装置,装置包括:
建模单元,用于基于卷积神经网络和注意力机制构建图像特征提取模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010005582.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序