[发明专利]基于多重注意力机制的车辆图像细粒度检索方法及装置在审
申请号: | 201910776963.3 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110704652A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 张斯尧;王思远;谢喜林;张诚;文戎;田磊 | 申请(专利权)人: | 长沙千视通智能科技有限公司 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/55;G06K9/62;G06N3/04 |
代理公司: | 43229 长沙德恒三权知识产权代理事务所(普通合伙) | 代理人: | 徐仰贵 |
地址: | 410000 湖南省长沙市高新开发区麓谷大道*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标对象 车辆图像 特征向量 图像 卷积神经网络 自动定位 相似度 注意力 检索 注意力机制 检索图像 图像输入 细粒度 准确率 | ||
1.一种基于多重注意力机制的车辆图像细粒度检索方法,其特征在于,包括:
将车辆参照图像输入到训练后的多重注意力卷积神经网络模型中,对所述车辆参照图像中的目标对象进行自动定位,并提取所述车辆参照图像中的目标对象的特征向量;
将待识别车辆图像输入到训练后的所述多重注意力卷积神经网络模型中,对所述待识别车辆图像中的目标对象进行自动定位,并提取所述待识别车辆图像中的目标对象的特征向量;
计算所述车辆参照图像中的目标对象的特征向量与所述待识别车辆图像中的目标对象的特征向量的相似度;
根据所述相似度,得到所述待识别车辆图像中包含与所述车辆参照图像中的目标对象同类别的目标对象的待识别车辆图像,作为所述车辆参照图像的检索图像。
2.根据权利要求1所述的基于多重注意力机制的车辆图像细粒度检索方法,其特征在于,所述将车辆参照图像输入到训练后的多重注意力卷积神经网络模型中,对所述车辆参照图像中的目标对象进行自动定位,并提取所述车辆参照图像中的目标对象的特征向量之前,还包括:
构建多重注意力卷积神经网络模型,并对构建的多重注意力卷积神经网络模型进行训练。
3.根据权利要求1所述的基于多重注意力机制的车辆图像细粒度检索方法,其特征在于,所述将车辆参照图像输入到训练后的多重注意力卷积神经网络模型中,对所述车辆参照图像中的目标对象进行自动定位,并提取所述车辆参照图像中的目标对象的特征向量,包括:
生成特征映射图;所述生成特征映射图包括:利用卷积操作在整幅所述车辆参照图像上为每类目标对象生成k×k个位置敏感分数图,所述k×k个位置敏感分数图用于描述所述每类目标对象对应位置的空间网格;每个位置敏感分数图有c个通道输出,用于代表c-1类物体外加一个图像背景;
基于每类目标对象的所述k×k个位置敏感分数图,提取每类目标对象的特征向量。
4.根据权利要求3所述的基于多重注意力机制的车辆图像细粒度检索方法,其特征在于,所述利用卷积操作在整幅所述车辆参照图像上为每类目标对象生成k×k个位置敏感分数图,包括:
对于一个w×h大小的候选目标框,将所述候选目标框划分为k×k个子区域,则每个子区域为w×h/k2大小,对于任意一个子区域bin(i,j),0≤i,j≤k–1,定义一个位置敏感池化操作:
其中,rc(i,j|Θ)是子区域bin(i,j)对c-1类物体外加一个图像背景的池化响应,zi,j,c是子区域bin(i,j)所对应的位置敏感分数图,(x0,y0)代表目标候选框左上角的坐标,n是子区域bin(i,j)中的像素数,Θ代表网络的所有学习得到的参数;
根据所述子区域bin(i,j)对c-1类物体外加一个图像背景的池化响应,得到每类目标对象的k×k个位置敏感分数图。
5.根据权利要求1所述的基于多重注意力机制的车辆图像细粒度检索方法,其特征在于,所述计算所述车辆参照图像中的目标对象的特征向量与所述待识别车辆图像中的目标对象的特征向量的相似度,包括:
所述车辆参照图像中的目标对象的特征向量与所述待识别车辆图像中的目标对象的特征向量的相似度的计算公式为:
其中,为所述车辆参照图像中的目标对象的特征向量,为所述车辆参照图像中的目标对象的特征向量,‖x‖为的范数,‖y‖为的范数,θ为和之间的夹角。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙千视通智能科技有限公司,未经长沙千视通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910776963.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序