[发明专利]图像识别方法、图像识别装置和电子设备有效
申请号: | 201810973554.8 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109271878B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 汪成;张骞;黄畅 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京彩和律师事务所 11688 | 代理人: | 刘磊;闫桑田 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 | ||
公开了一种图像识别方法、图像识别装置和电子设备。该方法包括:通过第一卷积神经网络从输入图像获得第一特征图;通过第一注意力模块获得与所述第一特征图相同形状的第一掩码,所述第一掩码用于加强所述待识别对象的区域的响应并抑制所述输入图像中待识别对象以外区域的响应;将所述第一特征图与所述第一掩码进行向量相乘后的第一向量乘积进行池化以获得第一特征向量;以及,通过第一全连接层基于所述第一特征向量进行分类以识别所述输入图像。这样,可以使得神经网络能够获得所述待识别对象在输入图像中的准确位置,从而提高图像识别率。
技术领域
本申请涉及图像识别领域,且更具体地,涉及一种图像识别方法、图像识别装置和电子设备。
背景技术
图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。
随着人工智能技术的快速发展,图像识别成为人工智能技术的一个重要领域。例如,行人再识别(Person re-identification)指的是从来源于非交叠的多个摄像机视场的行人图像库或视频流中识别出目标行人。这里,不同于单摄像头下普通的行人跟踪,行人再识别可以在不同的背景环境以及多摄像头设置下实现对特定行人的长期跟踪与监视,因此其在监控领域有着非常大的应用前景。目前该技术广泛应用于智能视频监控、智能安保等领域。
通常,在通过人工智能技术进行图像识别时,通过例如神经网络从输入图像提取特征以进行图像识别,但是,由于待识别对象在输入图像中的位置并不一定在图像中央,可能对图像识别造成困难。
因此,期望提供改进的图像识别方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种图像识别方法、图像识别装置和电子设备,其通过注意力模块加强待识别对象的区域的响应,以使得神经网络能够获得所述待识别对象在输入图像中的准确位置,从而提高图像识别率。
根据本申请的一个方面,提供了一种图像识别方法,包括:通过第一卷积神经网络从输入图像获得第一特征图;通过第一注意力模块获得与所述第一特征图相同形状的第一掩码,所述第一掩码用于加强所述待识别对象的区域的响应并抑制所述输入图像中待识别对象以外区域的响应;将所述第一特征图与所述第一掩码进行向量相乘后的第一向量乘积进行池化以获得第一特征向量;以及,通过第一全连接层基于所述第一特征向量进行分类以识别所述输入图像。
在上述图像识别方法中,通过第一注意力模块获得与所述第一特征图相同形状的第一掩码包括:使用大小为一的卷积核对所述第一特征图进行卷积滤波以获得卷积结果;以及,对所述卷积结果通过激活函数进行激活以获得所述第一掩码。
在上述图像识别方法中,使用大小为一的卷积核对所述第一特征图进行卷积滤波以获得卷积结果包括:使用大小为一的第一卷积核对所述第一特征图进行降维卷积滤波以获得中间结果;对所述中间结果通过线性整流函数进行激活;以及,使用大小为一的第二卷积核对激活后的所述中间结果进行升维卷积滤波以获得所述卷积结果。
在上述图像识别方法中,进一步包括:将所述第一特征图与所述第一向量乘积进行向量相加后通过第二卷积神经网络获得第二特征图;通过第二注意力模块获得与所述第二特征图相同形状的第二掩码,所述第二掩码用于加强所述待识别对象的区域的响应并抑制所述输入图像中待识别对象以外区域的响应;将所述第二特征图与所述第二掩码进行向量相乘后的第二向量乘积进行池化以获得第二特征向量;以及,通过第一全连接层基于级联的所述第一特征向量和所述第二特征向量进行分类以识别所述输入图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810973554.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人形识别方法及装置
- 下一篇:一种基于AI系统的银行取证方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序