[发明专利]一种全新的联机手写汉字识别方法和手写输入方法无效
申请号: | 99111467.1 | 申请日: | 1999-08-16 |
公开(公告)号: | CN1343953A | 公开(公告)日: | 2002-04-10 |
发明(设计)人: | 王颂平 | 申请(专利权)人: | 王颂平 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/18;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100051 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 全新 联机 手写 汉字 识别 方法 手写输入 | ||
汉字手写输入是建立在汉字识别基础上的一种方法,它靠计算机自动认识人写在纸或介质上的汉字。其最大优点是输入方便自然,使用者无须再学习,同时也为不希望许多人介入的保密资料输入计算机提供了方便,所以手写输入是办公自动化中不可缺少的文字输入设备,它对于扩大计算机在国民经济各部门的应用具有实际意义。
汉字识别有联机和脱机两种,由于汉字本身的复杂,使得机器识别的难度增大。手写输入利用的是联机手写汉字识别技术,它是汉字识别中最简单的一种类型。
国外的字符识别机,早在五十年代就投入实际使用。到七十年代,技术已经相当成熟。其印刷文字输入速度达到每秒数千字符,拒识率小于万分之一,误识率小于十万分之一。不仅如此,国外对于汉字识别也进行了大量的研究工作。
日本早在1977年就完成了“图象信息处理系统”中印刷汉字的识别装置。该装置识别速度为每秒100字,识别率达到99.9%;1984年,日本研制了识别2300字的多体印刷汉字识别装置,识别率为99.88%,识别速度大于每秒100字,代表了当时印刷汉字识别的最高水平。
我国在七十年代开始进行汉字识别的研究,当时主要用于邮政信函分拣中的字符识别,以及计算机输入用的英文、数字、符号的识别。后来一些大学、研究所开始对印刷体和手写体汉字识别进行研究,取得了一些成果。其中联机手写汉字识别,即我们通常所说的手写板的进展最受人们的关注。十多年前,军方首先研制出压敏型图形输入板,用普通的钢笔或元珠笔,即可在PC机上实现联机手写汉字识别,其识别率达到98%。其后上海、电子部某研究所以及一些大学都研制出各种手写输入器,在普通图形输入板和PC机上实现了手写汉字联机识别。
最近几年来,国内外汉字联机识别装置的研究开发非常活跃,各种手写板纷纷面世争夺市场。人们看到,随着科技和办公自动化的发展,汉字联机识别装置已经走向实用。
现在的手写板在价格上较前有所降低,使用性能上比较稳定可靠,识别率也有所提高。但是它仍然存在不小的问题:第一是输入速度;第二是识别率;第三是价格。
在许多研究者看来,要使手写板提高速度是没有可能的。他们认为,事情总是一利一弊,用手写比起键盘输入方便自然,怎么可能同时要求它快!因此,更多的专家和厂商关心的是提高识别率和降低成本,在性能和价格比中寻找新的市场:要么去生产低价位、对用户书写限制较严的低档产品;要么去研制开发能识别不受限制的各种自由书写体的高档产品。专家们更青睐于后者,他们期待手写板能做到象人作笔记时所用的字体和速度来书写,能识别行书手写汉字,不过这样一来,对于机器识别的要求就会大大提高,成本也会相应地增加。
总之,有鉴于现状,目前手写板的市场定位往往还只是针对输入量不大、对输入速度要求不高的一个群体。从这里我们也看到了手写板的局限和存在的问题,能否做到既快又好还省钱,这是汉字联机识别有待于解决的问题,也是国内外专家正在研究、攻克的一个难题。
本发明的目的就是为了克服上述现有技术的缺陷,为汉字联机识别提供一种全新的、极为简单、省事的汉字识别方法和输入方法。采用这种方法能够解决人们认为手写板不可能解决的输入速度问题,实现既快又好、造价低而且对使用者要求也低的综合性优良效果。
有关专家提出的汉字联机识别自由书写体问题,最终目的也是为了提高手写板的输入速度,这种思路的出发点是通过加强计算机软件的性能来实现的。但此方案即使可行,研制生产的成本也会大大增加,而识别率能达到什么指标也还是个问号。本发明从另一个完全不同的角度出发,既能解决手写板的速度问题和识别问题,同时还能大大降低生产成本。
能够实现上述目的的按照本发明的新的联机手写汉字识别方法和手写输入方法是,先将汉字的单笔划分成若干类。需要加以说明的是,依据不同的分类“标准”,可以分成五类、六类或者十类、八类不等,但这些方案总体上都是相同的。
以下结合附图说明本发明的第一个实施方案,它将单笔划分成六大类。
图1是按照本发明将汉字单笔划分成六类并与6个数字相对应的示意图。
图2是传统的“联机手写汉字识别”流程示意图。
图3是本发明流程示意图。
图4是本发明操作界面示意图和相关的机内码表。
下面请看图1,当将单笔划与1、2、3、4、5、6这六个阿拉伯数字对应以后,我们可以利用它对所有的汉字进行编码。方法是用这些数字作为笔划的代码,按书写顺序对字进行编码。假定设全部汉字中笔划数最多的字为k,则可将从1到k所指的每一笔划所对应的数字之间形成的全部数字串分成两大类:凡有汉字与之对应的数字串称之为有效数字,没有汉字与之对应的称为无效数字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王颂平,未经王颂平许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99111467.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子信息传递及电子邮件识别的方法和系统
- 下一篇:短指和身高相关基因