[发明专利]大规模图片集中基于语义一致性的近似搜索方法有效
申请号: | 201710368677.4 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107133348B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 胡鸣珂;胡海峰;吕成钢 | 申请(专利权)人: | 胡海峰 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/50 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 211300 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 图片 集中 基于 语义 一致性 近似 搜索 方法 | ||
1.在大规模图片集中基于语义一致性的近似搜索方法,其特征在于:所述方法包括如下步骤:
步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n代表图片集中图片的个数,d是图片特征的维度,c是类标记的数量;
步骤2:从图片集中随机抽取一部分图片作为抽样图片集;
步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;转换矩阵A的计算过程如下:
步骤(1)、定义图片间的关系矩阵W是一个n*n维的矩阵,关系矩阵中的每一个元素定义为:
Wij=exp(-||A(xi-uj)||2) (1)
上式中A表示转换矩阵,xi表示图片集中的第i张图片,uj表示抽样图片集中的第j张图片;
步骤(2)、定义目标函数式为:
其中,fi表示第i个图片样本的类标记向量,类标记向量是c维的列向量,向量中元素的值为1或0,分别表示图片属于这个类和不属于这个类,fj表示抽样图片集中第j个图片的类标记向量;
步骤(3)、根据随机梯度下降算法优化转换矩阵A,迭代更新规则如下:
其中,γt是每次迭代过程中的优化步长,转换矩阵的初始值为I/δ,I是d*d维的单位矩阵,δ是图片集中各图片之间欧氏距离的中位数;
步骤(4)、图片集中所有的图片样本遍历结束后,即得到最终优化完成的转换矩阵A;
步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过关系矩阵构建出相似矩阵Z,结合相似矩阵得到编码矩阵,对大规模图片数据集中的各图片利用编码矩阵进行哈希编码,将图片由原始的d维特征压缩映射成k维的二进制编码;
步骤5:对于一个新的查询图片q,通过编码矩阵计算出查询图片的二进制编码,与图片数据集中各图片的二进制编码比较汉明距离,如果汉明距离小于设定的门限阈值r,即认为两图片是近似图片。
2.根据权利要求1所述的近似搜索方法,其特征在于:步长γt选取以下值中的一种:1*10-5,1*10-4,1*10-3,或者1*10-2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡海峰,未经胡海峰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710368677.4/1.html,转载请声明来源钻瓜专利网。