[发明专利]用于图像识别的尺度健壮的基于特征的标识符有效
申请号: | 200980114051.4 | 申请日: | 2009-04-21 |
公开(公告)号: | CN102016880A | 公开(公告)日: | 2011-04-13 |
发明(设计)人: | 米罗斯瓦夫·博贝尔;保罗·布拉斯尼特 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;王伶 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 识别 尺度 健壮 基于 特征 标识符 | ||
技术领域
本发明涉及健壮的图像识别问题并且公开了相对于例如早期提交的共同未决专利申请EP 06255239.3、GB 0700468.2、GB 0712388.8、GB0719833.6和GB 0800364.2中所公开的那些现有技术的方法提供了优点的新方法。
背景技术
多媒体内容的健壮识别的目的在于提取可能对于多媒体内容执行的典型修改下保留的信息。该修改可以出于单纯或恶意的目的。在图像的情况下,当其中经受压缩、灰度变换、旋转、噪声、颜色变更、裁剪和平移(translate)等时,健壮的标识符应当基本上被保留。另外,标识符应当提供鉴别能力,使得无关的内容具有充分不同的标识符。
欧洲专利申请No.EP 06255239.3以及英国专利申请No.GB0700468.2、GB 0712388.8和GB 0719833.6的类似之处在于它们都基于全局信息提取标识符,全局信息是关于整个图像的信息。该系列的相关标识符以非常低的误报警率提供了接近100%的健壮性(这意味着它们提供了高鉴别能力),通常的误报警率小于百万分之0.1。
大量图像存在于各种图像数据库中,嵌入在网页、演示文稿和文档中。著名网站的调查显示Flickr具有超过20亿个图像,Photobucket具有超过40亿并且Facebook具有17亿。用户在他们的个人收集中常常具有数千个照片,并且专业人士将具有更多。为了实际使用给出的大尺寸的数据集,标识符必须也允许非常快速的搜索。专利申请EP 06255239.3、GB 0700468.2、GB 0712388.8和GB 0719833.6中公开的技术可以允许超过每秒1千万个图像的搜索速度。
尽管对于许多普通图像修改有高水平的健壮性,但是专利申请EP06255239.3、GB 0700468.2、GB 0712388.8和GB 0719833.6中公开的现有技术的标识符对某类图像修改无法提供所需水平的健壮性,在该类图像修改中图像内容的重要部分丢失或被代替,例如平移和裁剪。GB0800364.2中公开的技术提供了在该类图像修改的情况下的显著改进的健壮性。它是涉及i)特征检测和选择,ii)特征区域和标识符提取,以及iii)匹配的处理。本发明提出了对于现有技术图像标识符的健壮性的改进。
已经在计算机视觉和对象识别领域(后面的参考文献2、3)中开发了现有技术的特征点方法。方法依赖于非常大量的点:
“该方法的重要方面在于它生成密集地覆盖图像的大量特征...尺寸500×500像素的通常图像将导致大约2000个特征。”[后面的参考文献2]
提取大量特征的结果是搜索和匹配计算变得非常慢;在原始情况下,来自查询图像的所有特征应当与来自数据库中所有图像的所有特征相比较。为了减少搜索时间,现有技术的方法使用各种形式的数据结构,然而这些结构造成了附加的数据库初始化时间、附加的存储和内存需求的成本,并且常常进行一些用较低的检测率换取提高的搜索速度的近似。
本发明涉及检测图像和它们的修改版本,其不同于许多现有技术的应用领域。特别是,图像复制检测涉及查找图像的修改版本,例如已裁剪的、已压缩的等等。相反,大部分现有技术的方法涉及检测图像中的特定对象或者一类对象,例如Ford Focus汽车。尽管这些问题之间的区别可能看起来微不足道或者细微,但是它是重要的。例如考虑伦敦圣保罗大教堂的两幅图像,从两种不同的视角拍摄了图像。现在,在对象识别任务下,应当检测这些图像之间的相似性,但是在图像复制检测下,不应当检测相似性。想到这个,需要不同的技术来处理这两种不同的问题。
GB 0800364.2中公开的方法提出了基于迹变换的二元特征点描述符。使用二元描述符的优点在于,汉明(Hamming)距离用于特征匹配,这使得搜索处理非常快。而且,选择处理将特征的数量限制为被证明对于难的图像修改(例如裁剪和平移)来说令人惊讶地健壮的小集合。尽管健壮性好,但是期望提供进一步的改进。
发明内容
根据第一方面,本发明提供了一种通过处理与图像相对应的信号来得到该图像的表示(即,图像描述符)的方法。该方法包括得到该图像的尺度空间表示。处理该尺度空间表示,以检测在尺度空间表示中具有幅度极值(即极大值或极小值)的多个特征点。针对所检测到的多个特征点中的一个或更多个特征点,该方法确定与相应特征点相关联的尺度相关的图像区域。然后得到所确定的、尺度相关的图像区域各个的表示。
因此,可以基于图像的具有最高特征强度的特征来得到图像描述符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980114051.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序