[发明专利]用于脱机手写维吾尔文单词的字符切分方法无效
申请号: | 201010013727.5 | 申请日: | 2010-01-15 |
公开(公告)号: | CN101751569A | 公开(公告)日: | 2010-06-23 |
发明(设计)人: | 李静;卢朝阳;阿地力·依米提;曹琎;谭福秀 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 脱机 手写 维吾尔文 单词 字符 切分 方法 | ||
技术领域
本发明涉及一种数字图像处理方法,属于字符切分方法,可用于光 学字符识别中脱机手写维吾尔文单词的字符切分。
背景技术
随着手写字符识别应用领域不断扩展以及分类器识别能力的提高, 字符分割技术已经成为光学字符识别研究领域中的关键问题。实践表 明,字符切分不准确是产生误识别的主要原因之一,单字符正确识别率 的提高在很大程度上依赖于字符分割的准确性。
维吾尔文是我国一种重要的少数民族文字,属于阿尔泰语系突厥语 族西匈语支,仅在新疆地区就有900多万人使用维吾尔语进行交流和沟 通。开展维吾尔文识别的研究具有很高的理论价值和广阔的市场应用前 景。该技术的突破,对促进少数民族地区的信息化建设、促进民族和谐 发展,让少数民族群众共享信息化时代的丰硕成果等方面有重要意义。
目前,相对于中文、拉丁文、日文等主要文字识别系统的快速发展, 维吾尔文识别领域的发展明显滞后,尤其针对脱机手写维吾尔文识别研 究尚未见成熟报道。相比较与单字符识别,单词识别具有以下优势:(1) 更自然连贯的手写输入方式。人们在手写文字时,大部分都是以词为单 位在脑海中出现,如果将一个词中的字符逐个书写逐个识别,则很容易 影响思维的连贯性,因此,多字词的连续输入相对于单个字符逐个逐框 地输入更显得自然和人性化;(2)更快速的手写输入及识别方式。直接对 词进行书写识别,可以不用间断的将一个词输入,并进行单词整体识别。 目前,对于维吾尔文字符的识别已经有了一些研究成果,因此,如何将 单词中的字符正确切分出来,输入字符识别模块,是必须要解决的瓶颈 问题。由于包含了上下文信息,只要切分问题能处理的较好,则整词的 识别效果将优于字符的识别。
但是,由于维吾尔文单词无统一的高度、宽度,单词中存在字母间 前连、后连和前后连等情况,同时,连接方式不同的字母书写形式也不 同,这就造成一个单词中经常存在多个连通的伪词汇的现象,这种情况 在手写维吾尔文中更为突出。以上特点使得维吾尔单词的字符切分问题 变得很复杂,作为维吾尔文单词识别中关键步骤的字符切分,其目标就 是把含有手写单词的二值图像,切分为多个正确的二值化单字符图像。
目前,普遍采用的字符切分方法有:投影分析法、基于边缘跟踪的 方法、基于识别的方法、基于细化字符的方法、基于神经网络的方法、 基于形态学算子的方法等。其中:
投影分析法主要是利用字符串的垂直投影来检测切分点位置。如果 字符之间分离性比较好,字符间空隙的投影值将为零,在处理字体排列 整齐,规范,且质量较好的印刷体图像时,该方法简单、实用而且有效, 但是当手写文字书写复杂起来时,由于字符串之间互相搭粘,因而这种 简单的方法往往效果较差,无法解决问题。
基于边缘跟踪的方法,通过寻找轮廓线相对应的局部凹点来确定分 割路径,这是一类较有潜力的切分方法,但是如何有效地提取笔划信息 仍然有待于进一步研究。该类方法的缺点是计算复杂,效率较低,而且 对于字迹潦草的手写体,它们的笔划类别和边界往往难以准确定义,因 此取得的切分效果不理想。
基于识别的方法,这类方法主要的特点是利用识别结果来决定切分 结果,认为字符的切分应与字符识别紧密结合。但是,对于字符集较大 的识别,用该方法是一个很耗时的过程。如果用识别的结果来验证切分 的有效性,则取得速度和性能都比较好的切分效果将是相当困难的。
针对手写维吾尔文字符切分,上述几类方法同样存在以下困难,具 体表现在:
投影分析法的基本原理是利用字符串的垂直投影来检测切分点位 置,但是手写维吾尔文字往往出现笔画互相搭粘,附加字符位置偏移等 问题,无法准确定位出字符串垂直投影的局部极小点,或者会对字符产 生割裂切分等现象。
基于边缘跟踪的方法其缺点在于需要跟踪文字的轮廓线,手写维文 单词一般包含较多字符,书写不规范,采用此方法对笔画进行跟踪,计 算较复杂,相对于投影分析法效率偏低。
基于识别的方法需要根据识别结果确定切分结果,维文字符共32 个,具有128种变化形式,字符之间相似程度较高,如果将两者耦合, 用识别结果来验证切分的有效性,要取得速度和性能都比较好的切分效 果是比较困难的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010013727.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通过蓝牙控制字幕切换的系统及方法
- 下一篇:用于等离子显示器的驱动方法