[发明专利]基于监督转移的零样本哈希图片检索方法在审
申请号: | 201710253104.7 | 申请日: | 2017-04-18 |
公开(公告)号: | CN107346327A | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 杨阳;罗雅丹;陈纬伦;沈复民;邵杰;申恒涛 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 电子科技大学专利中心51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于监督转移的零样本哈希图片检索方法,属于图像哈希技术领域。本发明利用现有自然语言处理模型对已有训练数据的标签进行建模,形成一个标签空间。通过新的标签空间潜在的保存标签之间的关系,训练从图片特征空间到标签空间的映射。在此基础上,将此映射关系反映在哈希码上。本发明对训练样本没有严格要求,应用范围广,特别是在大型数据库里,当类别较多且无法对每一个类别找出训练样本时,本发明可以极大程度地提高对于该类别的图片检索准确率。 | ||
搜索关键词: | 基于 监督 转移 样本 希图 检索 方法 | ||
【主权项】:
基于监督转移的零样本哈希图片检索方法,其特征在于,包括下列步骤:步骤1:对训练样本集进行图片与图片标签的预处理,得到训练样本集的图片特征向量集X、标签向量集Y,每个训练样本的图片特征向量用xi表示,对应的标签向量为yi,下标为训练样本标识符;步骤2:基于训练样本的图片特征向量集X、标签向量集Y进行哈希函数训练:步骤201:随机初始化语义整合矩阵R、哈希码矩阵B、映射关系矩阵W、哈希矩阵P;其中,RTR=Ic,Ic表示c×c的单位矩阵,c表示预设的类别数目,符号(·)T表示矩阵转置;矩阵B=[b1,b2,…,bn]∈{‑1,1}l×n表示所有训练样本哈希码构成的哈希码矩阵,l表示哈希码的长度,n表示训练样本集数量,bi∈{‑1,1}1×n表示第i个样本的哈希码,i=1,2,…,n;映射关系矩阵W表示从哈希码到监督的标签向量的映射关系矩阵,且W为l×c维的实数域矩阵;哈希矩阵P为l×m维的实数域矩阵,其中m表示标签向量的维数;步骤202:从训练样本的图片特征向量x中随机选择m个核:a1,a2,…,am,根据公式计算φ(x),其中x表示任意训练样本的图片特征向量,平衡系数δ的取值范围为[‑1,1],m对应标签向量的维数;步骤204:根据L=D‑S构建拉普拉斯矩阵L,其中D是一个对角矩阵,S表示样本的相似度矩阵,矩阵D的第i个对角元为矩阵S的元Sij表示训练样本i、训练样本j的图片特征向量xi、xj之间的相似度,相似度Sij的计算公式为:当xi在xj的预设领域内或xj在xi的预设领域内时,否则Sij=0;其中σ的取值范围为0~1;步骤205:对目标方程进行离散求解,迭代得到语义整合矩阵R、哈希码矩阵B、映射关系矩阵W、哈希矩阵P的最优解,所述目标方程为:minf,W,B,R||RTY-WTB||F2+λ||W||F2+α||f(X)-B||F2+β||P||F2+γΣi=1nΣj=1nSij||f(xi)-f(xj)||F2]]>其中,表示矩阵的Frobenius范数,平衡参数λ、α、β、γ均为大于0的数,映射关系f是从特征空间到哈希码的哈希函数;步骤3:基于步骤2得到的哈希矩阵P,根据公式f(x)=PTφ(x)生成各训练样本的哈希码;步骤4:输入待检索对象的图片It,并提取得到图片特征向量xt、标签向量yt;采用步骤202相同的方式计算当前图片的φ(xt),再基于步骤2得到的哈希矩阵P,通过公式f(xt)=PTφ(xt)生成当前图片的哈希码;基于哈希码,在检索范围中查找出目标图像的k个最邻近图像进行检索结果返回,其中k为预设值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710253104.7/,转载请声明来源钻瓜专利网。