[发明专利]构建级联分类器的方法、识别对象的方法及装置有效
申请号: | 200910161237.7 | 申请日: | 2009-07-24 |
公开(公告)号: | CN101964059A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 朱远平;孙俊;皆川明洋;堀田悦伸;直井聪;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 潘士霖;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 级联 分类 方法 识别 对象 装置 | ||
技术领域
本发明总体上涉及模式识别领域,更具体地涉及级联分类器。
背景技术
随着计算机技术的发展,图像处理技术也取得了很大的进步。目前,人们已经能够采用光学字符识别(OCR)技术将一个文档图像中的文字识别出来,避免了繁重的人工键盘录入的劳动。
众所周知,字符语言类型识别技术有助于提高OCR的性能。现有的大部分字符语言类型识别技术的文本单位是整篇文档图像、文本行或词,这要求在文本单位内存在语言同一性的假设,因此在使用上具有一定的局限性。
然而,实际中存在多语言混排文档,其中包括两种或两种以上的语言文字,各语言文字间混合排列,例如票据。如果采用上述字符语言类型识别技术对该混合文档进行识别,则可能产生不理想的识别结果。
为此,在Yefeng Zheng、Changsong Liu和Xiaoqing Ding所著的“Single character type identification”(SPIE Document Recognition andRetrieval IX论文集,4670卷,第49-56页,2002年)一文中公开了一种采用Fisher分类器和支持向量机(SVM)分类器来识别英文和中文字符的方法,其中,首先使用Fisher分类器计算Fisher分类置信度,然后再使用SVM分类器进一步提高识别准确度。
上述现有技术中的分类器运算复杂度高,构建代价较高,运算速度较慢。
发明内容
有必要提供一种构建方法较简单,分类速度较快的分类器来识别单字符语言类型。
本发明提出了构建一种级联分类器,该级联分类器可以用来识别单字符语言类型。
根据本发明的一方面,提供了一种构建级联分类器的方法,该级联分类器包括一个或多个级,每一级包括一个节点分类器,该方法包括:基于第一级样本集来构建第一级节点分类器作为临时级联分类器,循环执行以下步骤:基于下级样本集来构建下级节点分类器,该下级样本集是上级样本集中针对上级节点分类器的上级识别分数小于与上级节点分类器相对应的上级识别分数阈值与识别分数阈值偏量之和的样本的集合,识别分数阈值偏量是大于或等于0的数,将构建的下级节点分类器与临时级联分类器级联以构建新的临时级联分类器,比较增加该下级节点分类器前后的临时级联分类器的识别精度;以及如果增加下级节点分类器后识别精度不变或降低,则将删除下级节点分类器后的临时级联分类器确定为最终的级联分类器并终止循环,否则继续构建下一个下级节点分类器。
根据本发明的另一方面,提供了一种利用前述方法构建的级联分类器来识别对象的方法,包括:对于级联分类器的从第一级节点分类器到最后一级节点分类器的每一级节点分类器,循环执行以下步骤:获取对象的与节点分类器相对应的特征;将对象的与节点分类器相对应的特征输入到节点分类器进行识别;如果对象在节点分类器的识别分数小于与节点分类器所对应的识别分数阈值并且节点分类器不是最后一级节点分类器,则将对象输入到下一级节点分类器,否则将节点分类器的识别结果确定为最终的识别结果。
根据本发明的又一方面,提供了一种用于识别对象的装置,包括:特征获取单元,用于获取对象的特征;以及由上述构建级联分类器的方法所构建的级联分类器,与特征获取单元相耦合。
本发明的构建级联分类器的方法较简单,所构建的分类器分类速度较快,精度也比较高。
附图说明
本发明可以通过参考下文中结合附图所给出的详细描述而得到更好的理解。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中:
图1所示为根据本发明的第一实施例的构建级联分类器的方法流程图;
图2所示为根据本发明的第四实施例的构建下级节点分类器的一个实施例的示意图;
图3所示为根据本发明一个实施例的识别对象的方法流程图;以及
图4所示为根据本发明一个实施例的用于识别对象的装置。
具体实施方式
下面参照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
目前,GBK Level 1收录的中文字符集包括3755个字符。而英文字符集包括62个字符,包括:26个大写英文字、26个小写英文字和10个数字。大部分中文字符(例如表1所示的)与英文字符有较大差别。然而,有些中文字符(例如表2所示的)在结构上与英文字符相似。
表1:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910161237.7/2.html,转载请声明来源钻瓜专利网。