[发明专利]对图像进行分类的方法和设备无效

申请号：	201110026831.2	申请日：	2011-01-20
公开（公告）号：	CN102609713A	公开（公告）日：	2012-07-25
发明（设计）人：	张伦	申请（专利权）人：	索尼公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06T7/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	杜诚;李春晖
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图像进行分类方法设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及对视频或图像的分类(包含对象/不包含对象)，即视频或图像中对象的检测或识别，尤其涉及生成用于区分视频或图像中是否包含所要检测的对象的分类器的方法和设备，以及用所生成的分类器对图像进行分类的方法和设备。

背景技术

随着视频监控、人工智能、计算机视觉等应用的不断普及，对检测视频和图像中出现的特定对象，例如人、动物、车辆等等的技术的需求日益增加。在用于检测视频或者图像中的对象的方法中，已知有一类方法是采用静态图像特征来建立用于区分视频或图像中是包含对象还是非对象的分类器，从而用该分类器来对图像进行分类，即在图像中检测对象，其中对于视频，将每一帧视为一幅图像来进行检测。

Paul Viola和Michael Jones在“Robust Real-time Object Detection”，Second International Workshop On Statistical And Computational Theories Of Vision-Modeling，Learning，Computing，And Sampling，Vancouver，Canada，July 13，2001中公开了一种这样的技术。在Paul Viola等人的技术中，从图像中提取矩形块的像素和之间的差作为特征，通过AdaBoost方法从所提取的特征中选择更适合用来区分对象和非对象的特征来形成弱分类器，并且通过融合弱分类器来形成强分类器。这类方法比较适合在图像中检测例如人脸这样的对象，但是对于例如人这样的对象的检测的鲁棒性则不是很高。

发明内容

鉴于现有技术的上述不足，本发明旨在提供一种生成分类器的方法、设备和对图像进行分类的方法和设备，以提高图像中对象检测的鲁棒性。

本发明的一个实施例是一种生成用于区分对象图像和非对象图像的分类器的方法，包括：从输入图像中提取特征向量，其中所述特征向量包括多个第一候选特征，每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应，每个所述第一候选特征的提取包括：获得相应候选组合的多个第一区域的像素和或均值之间的差值，以得到所述第一轴方向上的第一差向量，和相应候选组合的多个第二区域的像素和或均值之间的差值，以得到所述第二轴方向上的第二差向量；获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量；以及获得所述第一投影差向量和第二投影差向量的大小的和，以作为所述第一候选特征；以及根据所述提取的特征向量训练出所述分类器，其中，这些候选组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。

本发明的另一个实施例是一种生成用于区分对象图像和非对象图像的分类器的设备，所述设备从输入图像中提取特征向量，其中所述特征向量包括多个第一候选特征，每个所述第一候选特征与沿第一轴的方向布置的多个第一区域、和沿与所述第一轴方向相交的第二轴的方向布置的多个第二区域和多个预定取向之一的候选组合相对应，并且所述设备包括：差计算单元，其针对每个所述第一候选特征，获得相应候选组合的多个第一区域的像素和或均值之间的差值，以得到所述第一轴方向上的第一差向量，和相应候选组合的多个第二区域的像素和或均值之间的差值，以得到所述第二轴方向上的第二差向量，并且获得所述第一差向量和第二差向量在相应候选组合的预定取向的直线上的第一投影差向量和第二投影差向量；以及特征计算单元，其获得所述第一投影差向量和第二投影差向量的大小的和，以作为所述第一候选特征；以及训练单元，根据所述提取的特征向量训练出所述分类器，其中，这些候选组合中的至少一个组合的多个第一区域和多个第二区域中的至少一个区域由单个像素构成。

根据本发明的上述实施例，分别基于沿两个方向布置的区域的像素来计算第一差向量和第二差向量，并且区域可以由单个像素构成，使得提取的特征得到丰富，并且所提取的特征能够更加真实地反映相应图像部分中对象边缘的分布。此外，通过不同的预定取向来假设对象局部的各种可能的边缘取向，能够进一步提高分类器的鲁棒性。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于索尼公司，未经索尼公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110026831.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种活性炭负载二氧化钛掺银光催化剂的制备方法
下一篇：简易换热型活性焦净化再生处理系统及方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]对图像进行分类的方法和设备无效

专利文献下载