[发明专利]局部描述子的提取方法、图片检索方法及图像匹配方法有效
申请号: | 201110358181.1 | 申请日: | 2011-11-11 |
公开(公告)号: | CN102521618A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 段凌宇;王春雨;杨爽;黄铁军;高文 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/64 | 分类号: | G06K9/64 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 局部 描述 提取 方法 图片 检索 图像 匹配 | ||
技术领域
本发明涉及图像检索技术,尤其涉及一种紧凑性的局部描述子的提取方法及使用提取方法的图片检索方法、图像匹配方法。
背景技术
现有技术中的图像检索方法包括:第一步,客户端获取待查询目标图片的局部描述子;第二步,客户端将局部描述子发送至服务端;第三步,服务端根据局部描述子在服务端内的数据库中查找相似图片,并将查找的相似图片发送至客户端。
为保证局部描述子能够正确表示目标图片,现有技术中在客户端获取的局部描述子为尺度不变描述子(Scale Invariant Feature Transform,简称:SIFT)或快速鲁棒的尺度不变特征(Speeded Up Robust Features,简称:SURF)。然而,上述SIFT和SURF均为多维向量的局部描述子,该局部描述子占用的空间比较大,由于网络带宽的限制,客户端无法较快的将上述局部描述子发送至服务端。进一步地,服务端根据占用空间较大的局部描述子查找相似图片也非常迟缓,进而严重影响了检索系统的查询响应时间,降低了查询效率。
为此,业内人士改进了上述的局部描述子,采用线性判别分析方法将上述高维向量的SIFT转化为低维向量的主成分分析尺度不变描述子(Principal Component Analysis-SIFT,简称:PCA-SIFT)。然而,经由多次实验验证,该PCA-SIFT降低了局部描述子的区分能力,其查找的相似图片的匹配度低,结果不准确。
发明内容
本发明提供一种局部描述子的提取方法,该提取方法获取的局部描述子相对于现有技术中的局部描述子具有较高的区分能力。
本发明还提供一种图片检索方法,用于解决现有技术中检索系统的查询响应时间长、查询效率低的问题。
本发明还提供一种图像匹配方法,用于较准确的查找与目标图片匹配的图像。
为实现上述第一个目的,本发明提供的局部描述子的提取方法,包括:
获取预检索的目标图片的一个以上的兴趣点;
根据预置规则获取所述目标图片中与每一兴趣点对应的N个子扇区,N为整数,且大于等于3;
针对每一兴趣点,根据所述N个子扇区中每一子扇区内部的像素建立像素梯度方向直方图,得到与所述N个子扇区对应的N个多维原始子局部描述子;
将每一多维原始子局部描述子与预置权重相乘,得到N个多维加权子局部描述子,所述预置权重为多维向量,所述预置权重的维数与所述多维原始子局部描述子的维数相同;
在预置的量化词典中查找与所述多维加权子局部描述子相似的视觉单词,得到与每一兴趣点对应的N个视觉单词;
将查找的所有兴趣点的所有视觉单词组成所述目标图片的局部描述子。
由上述技术方案可知,本发明的局部描述子的提取方法,针对目标图片获取N个多维加权子局部描述子,并在预置的量化词典中查找与多维加权子局部描述子相似的视觉单词,并将该些视觉单词组成局部描述子,该局部描述子相对于现有技术中的局部描述子的区分能力的到较大的提高。
为实现上述第二个目的,本发明还提供一种图片检索方法,其包括:
客户端获取预检索的目标图片的一个以上的兴趣点;
所述客户端根据预置规则获取所述目标图片中与每一兴趣点对应的N个子扇区,N取整数,且大于等于3;
针对每一兴趣点,所述客户端根据所述N个子扇区中每一子扇区内部的像素建立像素梯度方向直方图,得到与所述N个子扇区对应的N个多维原始子局部描述子;
所述客户端采将每一多维原始子局部描述子与预置权重相乘,得到N个多维加权子局部描述子,所述预置权重为多维向量,所述预置权重的维数与所述多维原始子局部描述子的维数相同;
所述客户端在预置的量化词典中查找与所述多维加权子局部描述子相似的视觉单词及该视觉单词的位置标识符,得到与每一兴趣点对应的N个位置标识符;
所述客户端将所有兴趣点的所有位置标识符压缩并发送至服务端;
其中,所述量化词典与所述服务端的量化词典相同。
本发明还提供一种图片检索方法,其包括:
服务端接收客户端发送的压缩的位置标识符;
所述服务端对所述位置标识符解压缩,得到一组以上的位置标识符;针对每一组的位置标识符,在预置的量化词典中查找与所述位置标识符对应的视觉单词,将查找的所有的视觉单词作为目标视觉单词;
所述服务端在预置的原始视觉单词索引表中查找与所述目标视觉单词匹配的原始视觉单词,根据查找的原始视觉单词获得与所述原始视觉单词对应的结果信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110358181.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像处理的智能交通灯的控制方法
- 下一篇:图片过滤方法和装置