[发明专利]用于物体识别的图像数据库的制作方法、制作装置以及制作程序无效
申请号: | 201080035625.1 | 申请日: | 2010-06-02 |
公开(公告)号: | CN102460511A | 公开(公告)日: | 2012-05-16 |
发明(设计)人: | 井上胜文;黄濑浩一 | 申请(专利权)人: | 公立大学法人大阪府立大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06F17/30;G06T1/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 物体 识别 图像 数据库 制作方法 制作 装置 以及 程序 | ||
技术领域
本发明涉及用于物体识别的图像数据库的制作方法、制作装置以及制作程序。具体而言,本发明涉及压缩特征向量的表示并涉及在特定物体识别上的应用,其中使用关联数据结构。关联数据结构允许假阳性,当给定某个数据集和元素时,使用该数据结构来基于键(key)关联分配给每个数据(键)的值。
背景技术
特定物体识别是一项识别物体实例的任务。在本说明书中,描述使用如SIFT(例如参见非专利文献1)的局部特征向量的特定物体识别。
由于我们周围有许多物体,需要一种允许我们识别大量物体的特定物体识别技术来提供实际服务。局部特征是基于实数值的多维向量。由于局部特征的区别能力强,所以局部特征适用于识别许多物体。作为特定物体识别方法,基础的方法基于通过对从未知物体获得的特征向量和从已有物体获得的特征向量进行匹配而实现的投票。该方法采用特征向量的最近邻搜索进行匹配。该方法面临由大量特征向量造成的下列问题。最主要的问题涉及处理速度和存储量。
幸运的是,已针对处理速度问题提出了许多方法。这些方法的例子包括如k维树的树结构(例如参看非专利文献1)和基于哈希的方法(例如参看非专利文献1和非专利文献2)。这些方法所采用的近似最近邻搜索使我们可以极大地提高处理速度。
另一方面,存储量问题则难以实现突破。通常从一副图像提取几千个局部特征,而且,物体数增加时,需要大量存储器进行存储。
已提出了一些减少存储量的方法。例如,方法之一是基于称为“视觉词(visual words)”的经向量量化的特征向量减少所需存储量。该方法对于用于识别图像中一类物体(例如普通“汽车”类别)的“通用物体识别”是有效的。然而,这种方法不是特别适用于识别图像中物体实例(例如,“汽车”类别中特定的型号名称)的“特定物体识别”。为了实现大规模特定物体识别,必须增加视觉词数量。然而,为了实现大规模识别,只有两到三个特征向量可以与一个视觉词关联。据报道,如果多于两个或三个特征向量与一个视觉词关联,识别率就会降低(参看非专利文献4)。因而,这种方法的存储量减少有限。
另一种方法是利用标量量化(例如参看非专利文献5)或者通过选择特征向量(例如参看非专利文献6、非专利文献4)减少存储量。在这些使用近似最近邻搜索的方法中,需要计算特征向量的距离,这使得在任何情况下都需要存储各个特征向量。因而,需要与要存储的特征向量数成正比的存储量,因而,这种方法的存储量减少有限。
解决该问题的一个可能途径是省去进行匹配的距离计算。这样,不需要存储特征向量,从而可以极大减少存储量。基于这一考虑,提出了基于哈希的方法,其中,把特征向量存储在哈希表中,访问哈希表以进行识别(例如参看专利文献1和非专利文献2)。在该方法中,不是通过基于例如距离和相似度的量化概念的相似度搜索过程来进行特征向量匹配,而是通过特征向量是否具有同一哈希函数(同一哈希值)的标识过程来进行特征向量匹配。由于哈希表中仅标出特征向量的存在性,可以大大减少存储量。
引文列表
专利文献
专利文献1:国际公开WO2008/026414
非专利文献
非专利文献1:D.Lowe:“Distinctive Image Features fromScale-Invariant Keypoints”,International Journal of ComputerVision,Vol.60,No.2,pp.91-110(2004)
非专利文献2:野口和人,黄瀬浩一,岩村雅一:″近似最近傍探索の多段階化による物体の高速認識,″画像の認識·理解シンポジウム(MIRU2007)論文集,O S-B2-O2,pp.111-118(2007)。
非专利文献3:K.Kise,K.Noguchi and M.Iwamura:“Memory Efficient Recognition of Specific Obj ects with LocalFeatures”,Proc.Of the 19th International Conference of PatternRecognition(ICPR2008)WeAT3.1(2008).
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公立大学法人大阪府立大学,未经公立大学法人大阪府立大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080035625.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序