[发明专利]图像识别方法、图像识别装置和电子设备有效
申请号: | 201810973554.8 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109271878B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 汪成;张骞;黄畅 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京彩和律师事务所 11688 | 代理人: | 刘磊;闫桑田 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 | ||
1.一种图像识别方法,包括:
通过第一卷积神经网络从输入图像获得第一特征图;
通过第一注意力模块获得与所述第一特征图相同形状的第一掩码,所述第一掩码用于加强待识别对象的区域的响应并抑制所述输入图像中待识别对象以外区域的响应;
将所述第一特征图与所述第一掩码进行向量相乘后的第一向量乘积进行池化以获得第一特征向量;以及
通过第一全连接层基于所述第一特征向量进行分类以识别所述输入图像。
2.如权利要求1所述的图像识别方法,其中,通过第一注意力模块获得与所述第一特征图相同形状的第一掩码包括:
使用大小为一的卷积核对所述第一特征图进行卷积滤波以获得卷积结果;以及
对所述卷积结果通过激活函数进行激活以获得所述第一掩码。
3.如权利要求2所述的图像识别方法,其中,使用大小为一的卷积核对所述第一特征图进行卷积滤波以获得卷积结果包括:
使用大小为一的第一卷积核对所述第一特征图进行降维卷积滤波以获得中间结果;
对所述中间结果通过线性整流函数进行激活;以及
使用大小为一的第二卷积核对激活后的所述中间结果进行升维卷积滤波以获得所述卷积结果。
4.如权利要求1所述的图像识别方法,进一步包括:
将所述第一特征图与所述第一向量乘积进行向量相加后通过第二卷积神经网络获得第二特征图;
通过第二注意力模块获得与所述第二特征图相同形状的第二掩码,所述第二掩码用于加强所述待识别对象的区域的响应并抑制所述输入图像中待识别对象以外区域的响应;
将所述第二特征图与所述第二掩码进行向量相乘后的第二向量乘积进行池化以获得第二特征向量;以及
通过第一全连接层基于级联的所述第一特征向量和所述第二特征向量进行分类以识别所述输入图像。
5.如权利要求4所述的图像识别方法,进一步包括:
将所述第二特征图与所述第二向量乘积进行向量相加后通过第三卷积神经网络获得第三特征图;
通过第三注意力模块获得与所述第三特征图相同形状的第三掩码,所述第三掩码用于加强所述待识别对象的区域的响应并抑制所述输入图像中待识别对象以外区域的响应;
将所述第三特征图与所述第三掩码进行向量相乘后的第三向量乘积进行池化以获得第三特征向量;以及
通过第一全连接层基于级联的所述第一特征向量、所述第二特征向量和所述第三特征向量进行分类以识别所述输入图像。
6.如权利要求1所述的图像识别方法,其中,通过第一卷积神经网络从输入图像获得第一特征图包括:
通过第一卷积层对所述第一特征图进行降维卷积滤波并池化以获得中间特征图;以及
通过第二卷积层对所述中间特征图进行升维卷积滤波以获得所述第一特征图。
7.如权利要求1所述的图像识别方法,其中,通过第一全连接层基于所述第一特征向量进行分类以识别所述输入图像包括:
通过第一子全连接层对所述第一特征向量进行嵌入操作;以及
通过第二子全连接层对嵌入后的第一特征向量进行分类以识别所述输入图像。
8.如权利要求5所述的图像识别方法,其中,通过与所述第一全连接层的第一分类结果对应的注意力损失函数训练所述卷积神经网络和所述注意力模块。
9.如权利要求8所述的图像识别方法,其中,通过与所述第一全连接层的第一分类结果对应的注意力损失函数训练所述卷积神经网络和所述注意力模块包括:
将所述第三特征图与所述第三向量乘积进行向量相加后通过第四卷积神经网络获得第四特征图;
对所述第四特征图进行池化以获得第四特征向量;以及
通过与所述第一全连接层的第一分类结果对应的注意力损失函数和与所述第四特征向量对应的三元损失函数训练所述卷积神经网络和所述注意力模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810973554.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人形识别方法及装置
- 下一篇:一种基于AI系统的银行取证方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序