[发明专利]基于逻辑结构和布局的脱机字符识别无效
申请号: | 200680046450.8 | 申请日: | 2006-12-11 |
公开(公告)号: | CN101366017A | 公开(公告)日: | 2009-02-11 |
发明(设计)人: | K·H·切拉皮拉;P·Y·西麦德 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 张政权 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 逻辑 结构 布局 脱机 字符 识别 | ||
背景
用于诸如日语、汉语或韩语等东亚语言的字符识别是一个有挑战性的模式识别问题。这些字符的若干方面使该问题对于基于贝叶斯方法、神经网络、支持向量机、模板匹配以及最近邻算法的常规机器学习技术而言是困难的。导致这一困难的一方面是每种语言中的字符数量。东亚语言中的常见字符数量的范围从8000到20000以上。若干字符在这些语言中是共用的,但每种语言的独特的字符数量还是相当庞大的。当前识别和分类方法对于诸如英语、法语和德语等具有少于几百类的语言而言是有效的。然而,这些方法不能直接扩大到数千或甚至数万的东亚字符。
另一个挑战是分割手写体的东亚字符。采用手写体中,笔划可以合并成连续的曲线。笔划的合并很普遍以至于普通手写体字符演变成不像其印刷体,但是它允许轻易读写。这种常见的笔划合并使笔划分割很困难。因此,依赖于笔划分割以便字符识别的传统笔划分解方法对手写或草写字符表现不佳。
概述
为向读者提供基本理解,以下呈现了本公开的简化概述。本概述不是本公开的广泛综述,且它不旨在标识本发明的关键/重要元素或描绘本发明的范围。其唯一目的是作为稍后提出的更详细描述的序言来以简化形式呈现此处公开的一些概念。
此处所描述的是针对用于字符识别的方法和系统的各种技术和方法。根据所描述的技术的一个实现,在字符识别器上接收一输入字符。该输入字符由处于特定布局中的一个或多个逻辑结构组成。该逻辑结构可是偏旁部首、字符或一个或多个笔划的任何其他集合。标识输入字符中的逻辑结构的布局。可以使用时间数据、大小数据或有益于标识的其他数据来标识布局。基于输入字符中的逻辑结构的布局来选择一个或多个分类器。整个字符然后被输入所选分类器中。所选分类器识别逻辑结构且对其分类。然后组合来自所选分类器的输出以形成一输出字符向量。
通过参考结合各附图考虑的以下详细描述,许多伴随特征将更容易理解,同时被更好地理解。
附图描述
根据各附图阅读以下详细描述将更好地理解本描述,其中:
图1是示出示例性康熙偏旁部首的一个表。
图2是示出示例性汉字的分解的一个示意图。
图3示出了一个示例性模板路径分类器。
图4示出了一个示例性模板节点选通器(gater)。
图5是示出示例性字符识别器系统的一个框图。
图6是示出另一示例性字符识别器系统的一个框图。
图7示出又一示例性字符识别器系统的一个框图。
图8是示出用于识别字符的示例性过程的一个流程图。
图9是示出用于识别字符的另一示例性过程的一个流程图。
图10示出了其中可实现本发明的某些方面的一个示例性计算环境。
相同参考数字用来指定各附图中的相同部分。
详细描述
以下结合各附图提供的详细描述旨在作为本示例的描述,且不旨在表示其中可以构造或使用本示例的唯一形式。本描述描绘了该示例的功能以及用于构造和操作本示例的步骤的序列。然而,可以通过不同示例来完成相同或同等的功能和序列。
东亚字符系统通常是分层结构的。每个字符都由一个或多个笔划组成。某些组成笔划形成经常出现的被称为偏旁部首的子字符。组成偏旁部首通常出现在对字符而言唯一的特定位置中。某些偏旁部首也是字符,而其他偏旁部首在一语言中从来不独自出现。图1示出了表100,它示出在统一的字符编码标准范围[0x2F00-0x2FDF]中的214个示例性码康熙偏旁部首。
图2是示出画表格示例性汉字210分解成逻辑结构的一个示意图。每个逻辑结构都由一个或多个笔划组成。逻辑结构可以是笔划、偏旁部首、偏旁部首的组合或一个或多个笔划的任何其他集合。每个逻辑结构位于字符中的特定位置中。采用特定布局的逻辑结构的组合形成字符。在此示例中,字符210由三个逻辑结构240、250和260组成。字符210可以首先被分解成上部230和下部240。上部然后还可被分解成左部250和右部260。
图2所示的树型表示捕捉了字符210的布局。诸如220和230的每个内部节点是模板节点。该模板表示字符中逻辑结构的中间字符布局。例如,模板220表示上下布局。模板230表示左右布局。诸如240、250和260的叶节点表示组成字符210的简单逻辑结构。任何子树都表示部分字符,该部分字符也是一个逻辑结构。
在树型表示中,模板路径的一个示例是通过节点220、230和250。该示例模板路径捕捉了字符的左上特征。树型表示中的示例逻辑结构路径包括通过节点220和240的路径、通过节点220、230和250的路径以及通过节点220、230和260的路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680046450.8/2.html,转载请声明来源钻瓜专利网。