[发明专利]用于生成图像描述矢量的方法和设备、图像检测方法和设备有效
申请号: | 201210044156.0 | 申请日: | 2012-02-24 |
公开(公告)号: | CN103294685A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 姜涌;张文文;胥立丰 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 魏小薇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 图像 描述 矢量 方法 设备 检测 | ||
技术领域
本发明涉及用于生成图像描述矢量的方法和设备,以及图像检测方法和图像检测设备。
背景技术
在近几十年中,对于特定对象或目标(诸如人、面部、车辆等)的检测技术已取得了很大进步。为了描述图像的形态(morphology),可以从图像中提取判别性的特征或模式(pattern),以形成图像描述符(图像描述矢量)。在一些技术中,利用大量样本的训练过程是必要的。而对于更一般的或无需训练的对象检测,有效且强健的特征描述符(描述符矢量)是非常重要的。
近年来,作为用于描述图像的微结构的强有力的不因灰度而改变的(grey-scale invariant)局部纹理描述符,提出了局部二进制模式(LBP)描述符和局部三进制模式(LTP)描述符(例如请参见T.Ojala、M.Pietikainen和T.Maenpaa的“Multi-resolution Gray-Scale and Rotation Invariant Texture Classification with Local Binary Patterns”,IEEE Transaction on pattern analysis and machine intelligence,24(7),2002以及Xiaoyang Tan和Bill Triggs的“Enhanced Local Texture Feature Sets for Face Recognition Under Difficult Lighting Conditions”,IEEE Transactions on Image Processing,PP.1635-1650,19(6),2010)。这两种模式(图像描述符)被广泛用于面部识别领域,并且取得了很大成功。
现在将参照图1和图2简短地描述LBP描述符和LTP描述符。
图1是示出LBP描述符的原理的示意图。
如图1所示,LBP方法将图像中的每个像素编码成一个8位二进制码。更具体地,对于3×3的像素矩阵,如果相邻像素的像素值大于或等于中心像素的像素值,则8位二进制码中的表示该相邻像素的位被设为“1”,而如果相邻像素的像素值小于中心像素的像素值,则8位二进制码中的表示该相邻像素的位被设为“0”。以这种方式,通过相对于中心像素的像素值对八个相邻像素进行阈值判断,形成对于该中心像素的8位二进制码。在图1中,白色点表示二进制位“1”且黑色点表示二进制位“0”。LBP特征可描述被编码的像素(中心像素)周围的纹理结构。
然而,单个阈值和两像素比较使得LBP方法对于噪声非常敏感,且可靠性在强烈照明下将显著降低。此外,该编码方案将LBP特征限制为仅呈现小的纹理结构集合,如较亮或较暗的边缘和点。进一步地,由LBP特征代表的结构仅捕捉像素的周围特征,而该像素本身的特征被丢失。
图2是示出LTP描述符的原理的示意图。
如图2所示,LTP方法将图像中的每个像素编码为8位三进制码。更具体地说,对于3×3的像素矩阵,如果相邻像素的像素值大于上限阈值,则8位三进制码中的表示该相邻像素的位被设为“1”,如果相邻像素的像素值不大于该上限阈值且不小于下限阈值,则8位三进制码中的表示该相邻像素的位被设为“0”,而如果相邻像素的像素值小于该下限阈值,则8位三进制码中的表示该相邻像素的位被设为“-1”。上限阈值可被设为(中心像素值+T),而下限阈值可被设为(中心像素值-T),其中T是可按照适当方式设定的恒定裕量。以这种方式,通过相对于中心像素的像素值对八个相邻像素进行双重阈值判断,形成对于该中心像素的8位三进制码。在图2中,白色点表示三进制位“1”,黑色点表示三进制位“-1”,且灰色点表示三进制位“0”。
通过使用双重阈值判断,与LBP特征相比,LTP特征能以提高的强健性描述被编码的像素(中心像素)周围的纹理结构,并且可保留更加详细的图像结构。
发明内容
LTP特征可表示图像及其周围的38=6561种模式(结构),这远多于LBP特征所能呈现的28=256种模式。然而,本发明的发明人发现,这6561种LTP模式中的许多表示不希望的结构(例如,噪声模式的结构)。要存储和使用的太多模式导致描述图像时的低效率。也就是说,虽然LTP方法能够比LBP方法更精细地且以更强的强健性描述图像,效率却显著下降。
因此,需要一种用于生成图像描述矢量的新方法,该图像描述矢量能够精细地同时有效率地描述图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210044156.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于公交系统的路径规划方法及装置
- 下一篇:一种防近视字体的处理方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序