[发明专利]图像再识别方法、装置及电子设备有效
申请号: | 201810810555.0 | 申请日: | 2018-07-20 |
公开(公告)号: | CN108960189B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 魏秀参 | 申请(专利权)人: | 南京旷云科技有限公司;徐州旷视数据科技有限公司;北京旷视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 | ||
1.一种图像再识别方法,其特征在于,包括:
获取待识别图像的特征图和特征向量,所述特征向量是对所述特征图处理后得到的;
将所述特征向量输入循环神经网络,以使所述循环神经网络在第一时间步生成所述待识别图像的初步识别结果;
根据所述特征图和所述初步识别结果,得到注意力特征向量;
将所述注意力特征向量输入所述循环神经网络,以使所述循环神经网络在第二时间步根据所述注意力特征向量和所述初步识别结果,输出所述待识别图像的细分识别结果;
根据所述特征图和所述初步识别结果,得到注意力特征向量的步骤,包括:
根据所述特征图和所述初步识别结果,得到注意力特征图;
将所述注意力特征图输入第二池化层,得到所述注意力特征向量;
根据所述特征图和所述初步识别结果,得到注意力特征图的步骤,包括:
通过变换网络,将所述初步识别结果转换为注意力权重图;所述变换网络包括两层全连接层和位于所述两层全连接层之间的第一激活函数;
通过注意力网络,对所述特征图和所述注意力权重图进行计算,得到所述注意力特征图。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别图像的特征图和特征向量的步骤,包括:
通过卷积神经网络提取所述待识别图像的特征图;所述卷积神经网络包括至少一个卷积层;
通过第一池化层对所述特征图进行降维处理,得到所述特征向量。
3.根据权利要求2所述的方法,其特征在于,所述注意力权重图中包含的注意力权重值与所述特征图中包含的特征值一一对应;
所述通过注意力网络,对所述特征图和所述注意力权重图进行计算,得到所述注意力特征图的步骤,包括:
将每个特征值与对应的注意力权重值进行内积后通过第二激活函数,得到每个特征值对应的注意力分值;
对所述注意力分值进行全局归一化处理后,再与对应的特征值做元素乘积,得到所述注意力特征图。
4.根据权利要求2~3中的任一项所述的方法,其特征在于,在获取待再识别图像的目标特征图以及目标特征向量的步骤之前,所述方法还包括:
获取训练图像样本集;
采用所述训练图像样本集对所述卷积神经网络、所述变换网络、所述注意力网络或所述循环神经网络中的至少一种网络进行训练。
5.根据权利要求4所述的方法,其特征在于,所述采用所述训练图像样本集对所述卷积神经网络、所述变换网络、所述注意力网络或所述循环神经网络中的至少一种网络进行训练的步骤,包括:
从所述训练图像样本集中随机选取训练图像,通过所述卷积神经网络,得到所述训练图像的特征图以及特征向量;
将所述训练图像的特征向量输入所述循环神经网络,得到所述循环神经网络在第一时间步输出的所述训练图像的初步识别结果;
根据预设的第一特征标签,通过第一损失函数对所述训练图像的初步识别结果进行检验,得到第一损失函数值;
将所述训练图像的初步识别结果输入变换网络,得到所述训练图像的注意力权重图;
将所述训练图像的特征图和所述训练图像的注意力权重图输入所述注意力网络,得到所述训练图像的注意力特征向量;
将所述训练图像的注意力特征向量输入所述循环神经网络,得到所述循环神经网络在第二时间步输出的所述训练图像的细分识别结果;
根据预设的第二特征标签,通过第二损失函数对所述训练图像的细分识别结果进行检验,得到第二损失函数值;
将所述第一损失函数值与所述第二损失函数值之和作为损失函数值,基于所述损失函数值,对所述卷积神经网络、所述变换网络、所述注意力网络和所述循环神经网络中的至少一种网络的参数进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京旷云科技有限公司;徐州旷视数据科技有限公司;北京旷视科技有限公司,未经南京旷云科技有限公司;徐州旷视数据科技有限公司;北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810810555.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序