[发明专利]图像分类器生成方法和装置及图像分类方法和装置在审
申请号: | 201210337846.5 | 申请日: | 2012-09-12 |
公开(公告)号: | CN103679188A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 陈思源;何源;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 生成 方法 装置 | ||
技术领域
本申请总体上涉及图像处理的领域,更具体而言,涉及一种图像分类器生成方法和装置及图像分类方法和装置。
背景技术
图像分类是图像处理领域中的一个重要方面。在图像处理领域,很多图像处理需要根据图像分类的结果来进行。因此,图像分类的有效性和准确度对图像处理领域中的很多图像处理起着至关重要的作用。
文档图像是各种图像类型中的一种图像类型。文档图像一般具有固定的版面格式,其具体示例包括表单图像、执照图像、证书图像、收据图像、发票图像等等。文档图像一般包括预打印的内容和后打印的内容,其中,预打印的内容通常对应于文档的模板本身,例如空白表单等等;后打印的内容涉及机打或手工填写的内容,例如签字、图章等等。文档图像分类通常在文档的自动分发、归档、标引和提取等方面起到至关重要的作用。
目前,对图像进行分类的技术主要是像素级别的模板图像匹配。这种技术的缺点在于难以避免繁琐的制定模板、书写规则和确认系统的过程。另外,某些技术使用字符识别的结果,但是如果图像质量劣化,则识别结果变得不可靠,从而导致分类的结果变差。另外,现有技术中还存在一种基于机器学习对图像进行分类的技术,但是该技术需要大量的手工标注的样本作为训练集。然而,在实际应用中由于版权保护和信息安全等原因,通常不容易获得真实的训练样本,这使得基于机器学习对图像进行分类的技术难以应用于实际。另外,现有技术中还存在一种基于图形匹配进行图像分类的技术,虽然该技术不需要大量的训练数据,但是其适用范围往往局限于某种特定的版式(例如曼哈顿板块等),或者是假设可以获得完美的图像分割。因此,基于图形匹配进行图像分类的技术同样难以应用于实际。
因此,为了克服对图像进行分类的现有技术的上述缺点,本申请提出了一种新颖的和独创的对图像进行分类的技术,可获得如下技术益处中的至少之一:其适用范围广泛,需要的训练数据少,受图像格式、尺寸或质量的影响小,以及提高了图像分类的健壮性、准确性和有效性。
发明内容
在下文中将给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
根据本申请的实施例,提供了一种生成用于表单分拣设备的图像分类器的方法,包括:从多个样本图像中的每个样本图像中提取多个局部特征;将多个样本图像中的每个样本图像划分为多个子区域;将从多个样本图像中提取的多个局部特征中的至少与多个子区域中的同一子区域相关联的局部特征分为同一组;以及根据同一组中的局部特征生成与同一子区域对应的搜索树作为图像分类器。
根据上述方法,其中,子区域彼此交叠。
根据上述方法,其中,子区域为通过划分样本图像得到的网格、或通过对划分样本图像得到的网格按照方向进行划分而得到的分区。
根据本发明的另一实施例,提供了一种生成用于表单分拣设备的图像分类器的装置,包括:提取单元,用于从多个样本图像中的每个样本图像中提取多个局部特征;划分单元,用于将多个样本图像中的每个样本图像划分为多个子区域;分组单元,用于将从多个样本图像中提取的多个局部特征中的至少与多个子区域中的同一子区域相关联的局部特征分为同一组;以及生成单元,用于根据同一组中的局部特征生成与同一子区域对应的搜索树作为图像分类器。
根据上述装置,其中,子区域彼此交叠。
根据上述装置,其中,子区域为通过划分样本图像得到的网格、或通过对划分样本图像得到的网格按照方向进行划分而得到的分区。
根据本发明的又一实施例,提供了一种在表单分拣设备中对图像进行分类的方法,包括:从待分类的至少一个图像中的每个图像中提取多个局部特征;将待分类的至少一个图像中的每个图像划分为多个子区域;针对从待分类的至少一个图像中的每个图像中提取的多个局部特征中的每个局部特征,通过与多个子区域中的关联于该局部特征的子区域对应的搜索树,得到与该局部特征最相似的最近邻特征,以及根据与最近邻特征对应的图像类别得到每个图像的初级分类结果;以及根据多个初级分类结果进行投票,以得到每个图像的最终分类结果。
根据上述方法,还包括:根据与从待分类的图像中提取的多个局部特征中的每个局部特征最相似的最近邻特征,将待分类的图像与图像类别中的模板图像进行对准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210337846.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序