[发明专利]物体识别用图像数据库的制作方法、处理装置以及处理用程序无效

申请号：	200980115211.7	申请日：	2009-04-27
公开（公告）号：	CN102016918A	公开（公告）日：	2011-04-13
发明（设计）人：	野口和人;黄濑浩一;岩村雅一	申请（专利权）人：	公立大学法人大阪府立大学
主分类号：	G06T7/00	分类号：	G06T7/00
代理公司：	北京林达刘知识产权代理事务所(普通合伙) 11277	代理人：	刘新宇
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	物体识别图像数据库制作方法处理装置以及程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种物体识别用图像数据库的制作方法、处理装置以及处理用程序。更详细地说，本发明涉及如下一种图像数据库的制作方法、处理装置以及处理程序：能够从图像所涉及的数据库中检索示出有与出现在作为检索问题(Query：查询对象)的图像中的对象物一致的对象物的图像。

背景技术

当使用SIFT(Scale-Invariant Feature Transform：尺度不变特征转换)等局部描述符时，能够实现对于隐藏、照明条件的变动具有鲁棒性的物体识别，因此当前广受关注(例如参照非专利文献1、2)。识别的基础是被称为″Bag of Words″或″Bag of Features″的模型，不考虑局部描述符的配置、关联(conjunction)而仅以该局部描述符的频率为线索来识别物体。

在此，局部描述符表现了图像的局部特征，按照规定的过程抽取局部描述符，使得对于图像的变动(几何转换或照明条件、分辨率的差异)具有稳健(鲁棒性)的特性。另外，局部描述符是基于图像的局部区域而决定的，因此对于隐藏也具有鲁棒性。在本说明书中也将局部描述符称为特征矢量。这是由于该局部描述符是以矢量来表现的。

一般来说，从图像中抽取的局部描述符的数量为数百到数千，根据情况可至数万，因此，局部描述符的对照所需的处理时间和存储所需的存储器容量庞大。因而，在将识别精确度保持为固定水平的状态下怎样削减处理时间和存储器容量成为了重要的研究课题。

例如，在代表性的局部描述符SIFT中，各局部描述符表现为128维的矢量。另外，已知一种通过对SIFT实施主成分分析来削减维数的PCA-SIFT。尽管如此，作为实际使用的PCA-SIFT的一例，其维数也为36维。并且，通常使用应用于一般的数值表现的32位(bit)的float型或int型作为表示各维度的数值的数据类型。在需要更高的精确度的情况下使用64位的double型。另一方面，在数值的范围有限的情况下或即使牺牲精确度也要削减存储器容量的情况下，也有时特别地使用16位的short int型。即使在优先削减数据容量而特别地使用了short int型的36维的PCA-SIFT的情况下，每个局部描述符也需要16位×36维＝512位(64字节)的存储器。

在最邻近搜索中，通常对矢量进行距离计算来决定最邻近的局部描述符。如果降低各维度的数据的精确度则无法进行准确的最邻近搜索，则认为图像识别的精确度(识别率)会降低，这在以往是公知常识。

因此，以往在很多方法中，从如下方面进行研究：将从用于制作模型的图像中得到的局部描述符矢量量化(通过搜集类似的局部描述符并分类为规定数量的组，来将同一组的各局部描述符置换为该组的代表值进行表现的方法、聚类分析)来确定数千乃至数十万的visual word(相当于上述代表值)、使用该visual word来记述图像(例如，参照非专利文献3)。在对未知的图像进行识别时，将从该图像中得到的局部描述符转换成visual word并对频率等进行测量。在这种研究中，如果visual word的数量足够少则能够期待高速的处理。但是，另一方面，也被指出如果visual word的数量不多则无法达到足够的识别率(例如，参照非专利文献4)。如果visual word的数量增加，则与此相应地无法忽视矢量量化所需的计算时间，并且visual word本身的记录也会导致在存储器容量方面产生问题。

以上的优点/问题点在极端的情况下、即、将从用于制作模型的图像中得到的各个局部描述符直接设为visual word的情况下最为明显。例如，从VGA尺寸的通常的图像中可抽取两千个左右的局部描述符。因而，在将VGA尺寸的10万个图像用于模型制作的情况下，visual word的数量为2亿，对照和存储都需要庞大的计算资源。另一方面，通过将大量的局部描述符使用于模型，能够实现高精确度的识别。

针对处理时间问题的解决方案之一是在局部描述符的对照中导入“近似最邻近搜索”(例如，参照非专利文献5和专利文献1)。由此，例如在执行上述规模的识别任务的情况下，可知与单纯的全部对照的情况相比，该解决方案能够基本不降低识别率而使处理速度快至不足10^-6。另一方面，针对存储器容量的问题，使矢量量化稀疏是解决方案之一，但是这意味着识别率的降低，因此并非上策。

专利文献1：国际公开第2008/026414号小册子

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于公立大学法人大阪府立大学，未经公立大学法人大阪府立大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200980115211.7/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]物体识别用图像数据库的制作方法、处理装置以及处理用程序无效

专利文献下载