[发明专利]构建级联分类器的方法、识别对象的方法及装置有效
申请号: | 200910161237.7 | 申请日: | 2009-07-24 |
公开(公告)号: | CN101964059A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 朱远平;孙俊;皆川明洋;堀田悦伸;直井聪;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 潘士霖;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 级联 分类 方法 识别 对象 装置 | ||
1.一种构建级联分类器的方法,所述级联分类器包括一个或多个级,每一级包括一个节点分类器,所述方法包括:
基于第一级样本集来构建第一级节点分类器作为临时级联分类器,
循环执行以下步骤:
基于下级样本集来构建下级节点分类器,所述下级样本集是上级样本集中针对上级节点分类器的上级识别分数小于与上级节点分类器相对应的上级识别分数阈值与识别分数阈值偏量之和的样本的集合,所述识别分数阈值偏量是大于或等于0的数,
将构建的下级节点分类器与所述临时级联分类器级联以构建新的临时级联分类器,
比较增加该下级节点分类器前后的临时级联分类器的识别精度;以及
如果增加所述下级节点分类器后识别精度不变或降低,则将删除所述下级节点分类器后的所述临时级联分类器确定为最终的级联分类器并终止循环,否则继续构建下一个下级节点分类器。
2.如权利要求1所述的方法,其中在构建每一级节点分类器的过程中,在特征集中进行特征选择以选择与所述节点分类器相对应的特征。
3.如权利要求1所述的方法,其中构建下级节点分类器的步骤包括:
针对多个候选上级识别分数阈值,构建多个候选下级节点分类器;
从所述构建的多个下级候选节点分类器中选取识别精度最高的候选节点分类器作为所述下级节点分类器,以及
将所述下级节点分类器所对应的候选上级识别分数阈值作为上级识别分数阈值。
4.如权利要求1-3之一所述的方法,其中,所述级联分类器用于识别单个字符图像的语言类型。
5.如权利要求4所述的方法,其中所述特征集包括下述特征中的至少一个:字符纵横比、连通域数目、笔画像素密度、笔划密度直方图、游程直方图、水平投影差分累积、垂直投影差分累积、水平笔划密度差分累积和垂直笔划密度差分累积,
其中所述水平投影差分累积Cph通过如下公式1计算得到:
公式1:
所述垂直投影差分累积Cpv通过如下公式2计算得到:
公式2:
在上述公式1和2中,M和N分别为待识别字符图像的高度和宽度,i和j为整数,Ph(j+1)和Ph(j)分别表示待识别字符图像的第j+1行和第j行的有效像素数,Pv(i+1)和Pv(i)分别表示待识别字符图像的第i+1列和第i列的有效像素数,
所述水平笔划密度差分累积Csh通过如下公式3计算得到:
公式3:
所述垂直笔划密度差分累积Csv通过如下公式4计算得到:
公式4:
在上述公式3和4中,M和N分别为待识别字符图像的高度和宽度,i和j为整数,Psh(j+1)和Psh(j)分别表示待识别字符图像的第j+1行和第j行像素的水平笔画密度,Psv(i+1)和Psv(i)分别待识别字符图像的表示第i+1列和第i列像素的垂直笔画密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910161237.7/1.html,转载请声明来源钻瓜专利网。