[发明专利]对图像进行分类的方法和设备无效
申请号: | 201110026831.2 | 申请日: | 2011-01-20 |
公开(公告)号: | CN102609713A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 张伦 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李春晖 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 进行 分类 方法 设备 | ||
技术领域
本发明涉及对视频或图像的分类(包含对象/不包含对象),即视频或图像中对象的检测或识别,尤其涉及生成用于区分视频或图像中是否包含所要检测的对象的分类器的方法和设备,以及用所生成的分类器对图像进行分类的方法和设备。
背景技术
随着视频监控、人工智能、计算机视觉等应用的不断普及,对检测视频和图像中出现的特定对象,例如人、动物、车辆等等的技术的需求日益增加。在用于检测视频或者图像中的对象的方法中,已知有一类方法是采用静态图像特征来建立用于区分视频或图像中是包含对象还是非对象的分类器,从而用该分类器来对图像进行分类,即在图像中检测对象,其中对于视频,将每一帧视为一幅图像来进行检测。
Paul Viola和Michael Jones在“Robust Real-time Object Detection”,Second International Workshop On Statistical And Computational Theories Of Vision-Modeling,Learning,Computing,And Sampling,Vancouver,Canada,July 13,2001中公开了一种这样的技术。在Paul Viola等人的技术中,从图像中提取矩形块的像素和之间的差作为特征,通过AdaBoost方法从所提取的特征中选择更适合用来区分对象和非对象的特征来形成弱分类器,并且通过融合弱分类器来形成强分类器。这类方法比较适合在图像中检测例如人脸这样的对象,但是对于例如人这样的对象的检测的鲁棒性则不是很高。
发明内容
鉴于现有技术的上述不足,本发明旨在提供一种生成分类器的方法、设备和对图像进行分类的方法和设备,以提高图像中对象检测的鲁棒性。
本发明的一个实施例是一种生成用于区分对象图像和非对象图像的 分类器的方法,包括:从输入图像中提取特征向量,其中所述特征向量包括多个第一候选特征,每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应,每个所述第一候选特征的提取包括:获得相应候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量;获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一候选特征;以及根据所述提取的特征向量训练出所述分类器,其中,这些候选组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
本发明的另一个实施例是一种生成用于区分对象图像和非对象图像的分类器的设备,所述设备从输入图像中提取特征向量,其中所述特征向量包括多个第一候选特征,每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应,并且所述设备包括:差计算单元,其针对每个所述第一候选特征,获得相应候选组合的多个第一区域的像素和或均值之间的差值,以得到所述第一轴方向上的第一差向量,和相应候选组合的多个第二区域的像素和或均值之间的差值,以得到所述第二轴方向上的第二差向量,并且获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量;以及特征计算单元,其获得所述第一投影差向量和第二投影差向量的大小的和,以作为所述第一候选特征;以及训练单元,根据所述提取的特征向量训练出所述分类器,其中,这些候选组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。
根据本发明的上述实施例,分别基于沿两个方向布置的区域的像素来计算第一差向量和第二差向量,并且区域可以由单个像素构成,使得提取的特征得到丰富,并且所提取的特征能够更加真实地反映相应图像部分中对象边缘的分布。此外,通过不同的预定取向来假设对象局部的各种可能的边缘取向,能够进一步提高分类器的鲁棒性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110026831.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序