[发明专利]用于图像分析的方法和系统有效
申请号: | 201280069515.6 | 申请日: | 2012-10-12 |
公开(公告)号: | CN104160409B | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | M·巴尔斯特里;G·弗朗西尼;S·莱珀索伊 | 申请(专利权)人: | 意大利电信股份公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 罗亚男 |
地址: | 意大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 分析 方法 系统 | ||
技术领域
本发明涉及图像分析领域。
背景技术
在图像分析领域中,常见操作是比较两个图像以在这两个图像包括同一场景或同一对象的至少一部分的情况下找到其间发生的关系。
在大量的应用之中,至关重要的是进行图像比较来校准属于多相机系统的摄像机,评估在所拍摄视频的两帧之间发生的动作,并且识别图像(例如,照片)内的对象。由于被专门设计成在所谓的可视搜索引擎中利用的对象识别算法最近的发展,导致后一个应用呈现出越来越重要,即,从照片开始的自动化服务能够标识其内描绘的对象并且提供与所标识的对象相关的信息。这种类型的已知服务示例包括Google Goggles、Nokia Point&Find和kooaba Smart Visuals。对象识别应用被提供用于比较描绘待识别对象的第一图像(在行业术语中,被称为“查询图像”)与多个模型图像,每个模型图像描绘一个已知对象;这样允许执行在查询图像中描绘的对象和模型图像中描绘的对象之间的比较。
模型图像通常被布置在适当的模型数据库中。例如,在在线购物场景中利用对象识别的情况下,每个模型图像对应于在线商店提供的一个项目(例如,图书封面、DVD封面和/或CD封面的照片)。这里数据库中包括的模型图像的数量会相当大;例如在线购物服务的模型数据库可以包括数百万不同的模型图像。
用于执行两个图像之间的比较操作的一种非常有效的方式被提供用于在第一图像中选择点(在行业术语中,被称为关键点)的集合并随后将该集合中的每个关键点与第二图像中的一个对应关键点匹配。通过提前环绕该点本身的图像区域的局部特征(例如,点提取标度、区域优先定向以及所谓的“描述符”),有利地执行选择第一图像中的哪个点必须变成关键点的步骤。在图像分析领域,关键点的描述符是描述以关键点为中心的图像区域(称为贴片)的亮度梯度的数学算符,这种贴片根据贴片本身的主亮度梯度定向。
在David G.Lowe的“Distinctive image features from scale-invariant keypoints”(国际计算机视觉期刊,2004)中,提出了标度不变特征变换(SIFT)描述符;简单地说,为了允许可靠的图像识别,SIFT描述符在计及从与每个关键点对应的图像中提取的局部特征即便在图像标度、噪声和光照改变时也应该可检测的每个情况下生成。SIFT描述符因此对于均匀标度、定向是不变的,并且对于仿射失真和光照变化是部分不变的。
SIFT描述符是非常强大的工具,其允许选择关键点用以执行精确的图像比较。然而,这种精确性只有利用非常大量的数据才能被实现;例如,典型的SIFT描述符是128数据字节的阵列。由于每个每个图像中的关键点的数量相对较大(例如,对于标准VGA照片,1000-1500个关键点),并且由于每个每个关键点与对应的SIFT描述符关联,因此待处理数据的总量可能变得过多而难以有效管理。
这一缺点在场景涉及使用移动终端(例如,标识从通过智能电话的相机拍摄的照片提取的对象)的情况下加重。实际上,由于为了进行图像分析而将执行的操作非常复杂并且对计算负荷有要求,因此在这种情况下大多数操作通常在服务器侧执行;为了拥有执行分析所需的全部信息,服务器需要从移动终端接收全部所需的数据,包括用于所有关键点的SIFT描述符。因此,将从终端发送至服务器的数据的量可能变得过多而难以保证服务的良好效率。
根据本领域已知的解决方案(例如,Google Goggles所采用的方案),这一缺点通过从移动终端向服务器直接发送图像而非描述符来从根本上解决。的确,由于非常大量的关键点,对应的SIFT描述符的数据的量可能超过标准VGA照片本身的大小(以字节计)。
待处理数据的量可以通过在发送描述符阵列之前对其进行压缩而被有利地减少。例如,可通过矢量量化来压缩描述符阵列,所述矢量量化被提供用于将描述符阵列可具有的元组值近似为码本的码字的缩减集合。
待处理数据的量的进一步减少可以通过乘积码矢量量化(即,通过将描述符阵列再分成子阵列并在随后对每个每个子阵列应用矢量量化)压缩描述符阵列来实现。
Chandrasekhar V.等人:“Survey of SIFT Compression Schemes”(第二届国际移动多媒体处理研讨会暨第20届国际模式识别会议”ICPR 2010;伊斯坦布尔,土耳其;2010年8月23-26,2010年8月22(2010-08-22),第1-8页)执行文献中提出的标度不变特征变换(SIFT)压缩方案的综合调查,并在通用框架中对其进行评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于意大利电信股份公司,未经意大利电信股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280069515.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理装置和图像处理方法
- 下一篇:控制方法、系统和设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序