[发明专利]一种基于顶层权值的图像卷积特征的生成方法在审
申请号: | 201610875762.5 | 申请日: | 2016-09-29 |
公开(公告)号: | CN106503729A | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 赵士超;许有疆;韩亚洪 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06F17/30;G06Q30/06 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于顶层权值的图像卷积特征的生成方法,从互联网下载图片,构成图片训练集;训练卷积神经网络的模型;用训练好的卷积神经网络的模型分别提取图片的不同层的深度卷积特征;利用得到的深度卷积特征计算顶层的卷积权重图;用顶层的卷积权重图作用到从浅层到高层的卷积特征得到新的卷积特征;得到图片的增加了卷积全值的深度特征;通过对检索图片和被检索图片数据集分别提取顶层卷积权重的特征,求两者之间的相似距离,做最后的相似度匹配,得到最终的检索结果。与现有技术相比,本发明不仅适用于商品在中间区域,而是适用商品在任何位置,新的顶层权重特征相比于之前的高斯权重要更有效更准确,能够保证图片特征的鲁邦性和准确率。 | ||
搜索关键词: | 一种 基于 顶层 图像 卷积 特征 生成 方法 | ||
【主权项】:
一种基于顶层权值的图像卷积特征的生成方法,其特征在于,该方法包括以下步骤:步骤(1)、从互联网下载图片,并对每个图片进行描述,形成<图像,类别>对,构成图片训练集;图像表示为集合Nd是集合IMG中的图像总数;每个图像对应一个类别,类别表示为集合图像集合IMG以及每个图像对应的GroundTruth组成最终的数据集DataSet={IMG,GroundTruth};步骤(2)、通过图片数据集按照图像分类任务训练卷积神经网络的模型,在ILSVRC数据集上训练模型,或者用下载好的ILSVRC数据集重新训练模型;步骤(3)、用训练好的卷积神经网络的模型分别提取图片的不同层的深度卷积特征:GoogLeNet(X)inception(3a),GoogLeNet(X)inception(3b),GoogLeNet(X)inception(4a),GoogLeNet(X)inception(4e)NET(X)layer表示这个特征的是一个三维的矩阵C×W×H,其中C表示卷积层特征通道方向的个数,W表示卷积层特征的宽度,H表示卷积层特征的高度;步骤(4)、利用得到的深度卷积特征计算顶层的卷积权重图,提取GoogLeNet最后一层的卷积层的卷积特征GoogLeNet(X)inception(5b),对此卷积特征在通道方向做平均的池化操作,具体如下:W=1N×Σc=1NGoogLeNet(X)inception(5b),]]>其中N表示的是卷积特征的通道数目此方案中N=1024,c表示的是卷积特征第c个通道,W表示最终得到的顶层卷积权重;步骤(5)、利用顶层的卷积权重图作用到从浅层到高层的卷积特征得到新的卷积特征,具体包括:将步骤(3)提取的GoogLeNet的Inception(3a),Inception(3b),Inception(4a),Inception(4e)的特征;把这些特征都通过最大池化的方式,池化到和顶层卷积Inception(5b)同样大小的尺度上;把步骤(4)得到的顶层卷积的权重与拼接后的卷积特征进行相乘,得到加权后的深度卷积特征,具体公式如下:F_W(x,y)=W(x,y)×F(x,y)其中,W表示步骤(4)产生的顶层卷积权重,F表示的是步骤(5)中池化和拼接之后的卷积特征,F_W表示利用顶层权重W于多层拼接的卷积特征F对应的位置相乘得到的加权之后的特征,(x,y)表示的是卷积特征的坐标;步骤(6)、把这些卷积特征都池化成向量,得到图片的增加了卷积全值的深度特征,即把步骤(5)得到的加权过后的卷积特征F_W,进行最大池化,得到最终的目标向量作为图片的最终表达;Imagereresent=MaxPooling(F_W)其中池化的窗口大小是7×7;步骤(7)、通过对检索图片QueryImagerepresent和被检索图片EvaluationImagerepresent数据集分别提取顶层卷积权重的特征,求两者之间的相似距离Distance:其中表示度量两个特征之间距离的函数;最后根据被检索图像集的图像与检索图像之间的相似距离Distance进行排序,做最后的相似度匹配,得到最终的检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610875762.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种图像处理系统以及图像处理方法
- 下一篇:一种图像处理方法及移动终端
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序