[发明专利]脱机手写汉字识别系统及其识别方法无效
申请号: | 90110009.9 | 申请日: | 1990-12-29 |
公开(公告)号: | CN1016747B | 公开(公告)日: | 1992-05-20 |
发明(设计)人: | 夏莹;吴智彪;曾棋荣;王世琴;胡静芬;孙承鉴;张大华 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/72 | 分类号: | G06K9/72 |
代理公司: | 清华大学专利事务所 | 代理人: | 廖元秋 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脱机 手写 汉字 识别 系统 及其 方法 | ||
本发明属于模式识别和人工智能领域。
脱机手写汉字识别是识别已经写在稿纸上、白纸上或表格中的手写汉字。按书写限制的程度,一般可分为三种,即限制性手写体(指规定某些限制,如规定拓朴特性不变或要求横平竖直等),手写印刷体(指手写工整的汉字)和书写限制较少的手写汉字。限制越少,识别难度越大。目前国内外已研制出若干种能识别手写印刷体汉字的识别系统,例如,本申请人于89年3月23日申请的中国发明专利《光照输入手写印刷体汉字识别系统》(CN10458859)就是其中的一种识别系统。该系统由扫描器和微机组成,配有手写印刷体汉字识别卡及接口板。该系统采用汉字四边形状特征进行粗分类,用快速合并法抽取笔段,用相关属性关系图启发式匹配法进行细分的手写印刷体汉字识别方法。该系统的识别字数为2000常用汉字,识别率达90%。其不足之处是对书写字有较多的限制及较严的要求,即书写汉字不丢失、不添加笔划;笔划写直,字的四边框笔划要写清楚;笔划成型,转折处尽量尖锐;用黑色墨水、优质钢笔、写在稿纸上等等要求。这些要求对使用者带来诸多不便,限制了该系统使用范围。
本发明的目的是构成一种识别书写限制较少汉字的识别系统,克服上述汉字识别系统的不足之处,将使用者按自己习惯写在纸上的字,高速输入计算机,经过计算机识别,并输出正式文件来,为达此目的,本发明提出一种新的手写汉字识别方法。
本发明提出一种交互式自学习脱机手写汉字识别系统,由扫描、识别、编辑等部分,其中,扫描部分包括驱动光电扫描仪完成对文稿的扫描录入以及文字切分、规格化予处理等步骤,识别部分包括对扫描得到的文字图象进行模式识别,得到汉字机内码表示的文本文件等步骤,编辑部分包括对识别后的文本文件进行编辑修改及输出正式文件等步骤,其特征在于所说的识别部分采用汉字统计和结构两类特征相结合的统计识别方法,即抽取汉字适当部位的横、竖、左斜、右斜四个扫描方向的笔道计数做为统计特征(HVLR),以及汉字四边形状的稳定部分,经过模糊处理后作为结构特征的抽取方法。以及动态分类方法,即将所述统计和结构特征作为粗分类特征,对各类特征取候选集,然后作与、或集合运算,得到最后的分类侯选集,再作进一步的匹配、细分,得到识别结果。该系统还包括用以识别书写工整、字迹清楚的手写汉字的通用特征库以及为适应不同用户的书写习惯,计算机采用自学习方式为用户建立的专用特征库,建立专用特征库可采用两种方法,一种是:用户按照自己的书写习惯写出一个常用字表,该系统全自动地学习该用户的字型特征;另一种是:边输入学习,在文稿交互输入过程中,计算机逐个学习汉字的字型特征。
本发明提供的上述交互式自学习脱机手写汉字识别系统,对输入的手写汉字文稿限制少,能适用连笔、断笔现象,具有自动识别,人一机交互式识别、边输入边学习全自动学习等功能。
附图简要说明:
图1 为本发明实施例的系统程序框图
图2 汉字切割原理图
图3 汉字图象切割流程图
图4 为“的”字的HVLR特征
图5 为四边框形状特征码
本发明提供的一种最佳实施例由扫描仪、微型计算机主机、显示器、打印机以及装在主机内的扫描仪与主机的接口板和汉字识别卡等组成。扫描仪可采用HP、RICON和DATACOPY等各种扫描仪,如HP9190,HP9195,is 30,is11等。计算机主机可采用IBM-PC/XT兼容机、各种286,386机和长城机,如8088,80286或80386 CPU具有内存640K以上20M以上硬盘的计算机。本实施例系统工作流程框图如图1所示,由扫描、识别、编辑、机器学习等部分组成。结合附图对其工作原理详细描述如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/90110009.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:中文文章输入装置
- 下一篇:由烃类原料生产液态烃的工艺