[发明专利]大规模图片集中基于语义一致性的近似搜索方法有效
申请号: | 201710368677.4 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107133348B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 胡鸣珂;胡海峰;吕成钢 | 申请(专利权)人: | 胡海峰 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/50 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 211300 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 图片 集中 基于 语义 一致性 近似 搜索 方法 | ||
本发明公开了一种在大规模图片集中基于语义一致性的近似搜索方法,包括转换矩阵训练过程:在计算图片集中的图片和抽样图片的相似度时引入语义一致性,并获得下一阶段所需的转换矩阵;哈希编码过程:根据训练过程得到的转换矩阵计算出图片和抽样图片之间的优化相似度,并根据优化相似度构建相似矩阵进而利用哈希编码技术对图片集中的各图片进行二进制编码;然后比较新的查询图片和各图片二进制编码的汉明距离,从而找到查询图片的近邻。本发明在对图片进行相似性度量时引入语义一致特性,可以更为准确的度量图片之间的相似性,使用随机梯度下降法来减少算法的训练时间,能够有效地应用于大规模的图片数据集中。
技术领域
本发明涉及一种在大规模图片数据集中对图片进行近似搜索的方法,属于机器学习技术领域。
背景技术
近邻查询中一个重要的应用就是图片的近似搜索。在大数据时代,图片数据最明显的特点是数据规模极大,图片本身的特征维度很高。对于海量高维图片高效准确的近邻查询对计算机视觉、机器学习等前沿学科的研究有着极为重要的应用价值。
传统的近邻查询算法,比如基于树的索引结构的搜索算法,这种搜索算法都存在着维度的问题。由于对高维图片数据进行近似近邻搜索时性能急剧下滑,已不适用于当今的大数据时代。现在最为流行的方法是基于哈希技术的近似近邻搜索,经典的近似搜索哈希算法如局部敏感哈希算法(LSH),通过将近邻搜索问题转换为寻找相似的二进制编码来解决。基于哈希技术的近似搜索算法具有更为简单的索引结构和更少的存储空间。但是LSH为了同时保证精度和召回率,需要构建多个哈希表,导致查询时间和存储开销的大幅增加。
随之又出现了可以产生更为高效编码的哈希算法,一种基于图的哈希算法由于可以更好的度量图片样本之间的相似性从而能够获得更好的性能。比如谱哈希(SH)算法,锚哈希(AGH)算法。但是这些算法在寻找近邻图片时过于片面,它们只考虑了图片在数据集中的实际存储位置,而没有考虑图片可能具有的语义标记信息,这样使得这些算法在图片近似搜索中的性能较差。在现实的大规模图片数据集中,很多图片具有语义标记信息,不同的类标记信息代表图片属于不同的类别。比如两张图片在数据集中可能实际存储距离较远,但是它们具有相同的类标记“天空”,那么这两张图片也是近似图片。而且目前流行的图片近似搜索算法应用在大规模图片数据集上时往往性能较差,不能很好的解决实际问题。
发明内容
本发明所要解决的技术问题是:提供一种应用于大规模图片数据集中的基于语义一致性的近似图片搜索方法。主要解决图片的近似搜索问题并将相似的图片通过哈希技术映射成相同或相似的二进制编码。
本发明为解决上述技术问题采用以下技术方案:
本发明提出一种在大规模图片集中基于语义一致性的近似搜索方法,所述方法包括如下步骤:
步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n是图片样本的个数,d是图片特征的维度,c是类标记的数量;
步骤2:从图片集中随机抽取一部分图片作为抽样图片集;
步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;
步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过关系矩阵构建出相似矩阵Z,结合相似矩阵得到编码矩阵,对大规模图片数据集中的各图片利用编码矩阵进行哈希编码,将图片由原始的d维特征压缩映射成k维的二进制编码;
步骤5:对于一个新的查询图片q,通过编码矩阵计算出查询图片的二进制编码,与图片数据集中各图片的二进制编码比较汉明距离,如果汉明距离小于设定的门限阈值r,即认为两图片是近似图片。
进一步,本发明的近似搜索方法,转换矩阵A的计算过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡海峰,未经胡海峰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710368677.4/2.html,转载请声明来源钻瓜专利网。