[发明专利]图像识别装置以及图像识别方法有效
申请号: | 201210082473.1 | 申请日: | 2012-03-26 |
公开(公告)号: | CN102799854A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 棚瀬宁;三浦健;等等力康弘;椎野寿树;羽深兼介;滨田哲也;安田泰代 | 申请(专利权)人: | 株式会社摩如富;株式会社NTT都科摩 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 装置 以及 方法 | ||
技术领域
本发明的各个方面以及实施方式涉及图像识别装置以及图像识别方法。
背景技术
以往,作为图像识别装置,公知有如下这样的装置:将作为识别对象的对象图像分割为块状而生成块图像并将块图像分类为预先设定的多个类别(例如,参照专利文献1)。专利文献1所述的装置采用教师图像在将图像特征作为坐标轴的特征量空间中按照每个类别来学习分离平面,并根据分离平面以及与块图像的特征量的大小对应的坐标位置,将块图像分类为类别。块图像的特征量是该块图像的图像信息(颜色空间信息以及频率分量)。
【专利文献2】日本特开2010-45613号公报
但是,在专利文献1所述的图像识别装置中,有时难以将块图像分类为合适的类别。例如,在块图像是蓝色一种颜色的情况下,难以判断该块的类别为“天空”还是“水池”。
发明内容
在本技术领域中,期望一种能够提高分割对象图像而获得的块图像的分类精度的图像识别装置以及图像识别方法。
本发明一个方面的图像识别装置的特征在于,构成为一种图像识别装置,在以图像的特征为坐标轴的第1特征量空间中,预先学习为了将所述图像分类为预先设定的类别而采用的分离平面,并利用所述分离平面,将分割对象图像而获得的块图像分类为所述类别,该图像识别装置的特征在于,具备:输入部,其输入所述对象图像;块图像生成部,其将所述对象图像分割为多个块而生成多个所述块图像;特征量计算部,其计算所述块图像的特征量;以及类别判别部,其采用与所述第1特征量空间中的所述块图像的特征量的大小对应的坐标位置以及所述分离平面,判别所述块图像是否被分类为所述类别,所述特征量计算部采用根据该块图像的图像信息算出的局部特征量以及根据所述对象图像整体的图像信息算出的整体特征量,作为所述块图像的特征量,并且,
在以所述块图像的多个特征为坐标轴的第2特征量空间中,采用组合所述块图像的多个所述局部特征量而成的特征量矢量的坐标位置和所述第2特征量空间的一个或多个任意区域,按照每个区域对具有属于所述区域的所述特征量矢量的所述块图像进行计数,将按照每个区域计得的所述块图像的数量包含在所述整体特征量中。
根据本发明一各方面的图像识别装置,作为块图像的特征量,不仅采用根据该块图像的图像信息算出的局部特征量,还采用根据对象图像整体的图像信息算出的整体特征量,所以不仅能利用块图像其本身的信息还可以考虑块图像与对象图像之间的关系而对块图像进行分类。因此,在仅利用块图像无法判断类别的情况下,有时只要观察对象图像整体就能够判断块图像的类别。此外,作为整体特征量,包含:在以块图像的多个特征为坐标轴的第2特征量空间中,采用组合块图像的多个局部特征量而成的特征量矢量的坐标位置和第2特征量空间的一个或多个任意区域,对具有属于区域的特征量矢量的块图像按照每个区域进行计数后得到的块图像的数量。因此,可以组合多个局部特征量来构成新的特征量,并采用新的特征量进行分类。由此,能够避免偏向一个局部特征量进行分类的情况。所以,能够提高块图像的分类精度。
这里,所述特征量计算部还可以在所述整体特征量中包含:在整个所述对象图像整体中包含的所述块图像中所述局部特征量的大小为预定值以上的所述块图像的数量、或者所述局部特征量的大小小于所述预定值的所述块图像的数量。通过这样的结构,整体特征量不仅仅为反映了对象图像整体的特征(例如局部特征的位置关系)的特征量,还可以为进一步强烈地反映了局部特征本身的特征量。因此,利用局部特征量影响强的整体特征量来弥补当根据对象图像整体的特征量进行判断时误识别的块图像,从而能够正确地进行识别。因此,可提高块图像的分类精度。
此外,所述图像识别装置具备对象区域图像提取部,该对象区域图像提取部从所述对象图像中提取对象区域而作为对象区域图像,所述块图像生成部将所述对象区域图像分割成多个块而生成多个所述块图像。通过这样的结构,利用对象区域图像提取部,从对象图像中提取对象区域图像,并对所提取的对象区域图像以块为单位进行识别处理。因此,即使是比例变化或被摄体位置偏移了的对象图像也能够适当地进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社摩如富;株式会社NTT都科摩,未经株式会社摩如富;株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210082473.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序