[发明专利]用于脱机手写维吾尔文单词的字符切分方法无效

专利信息
申请号: 201010013727.5 申请日: 2010-01-15
公开(公告)号: CN101751569A 公开(公告)日: 2010-06-23
发明(设计)人: 李静;卢朝阳;阿地力·依米提;曹琎;谭福秀 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/20 分类号: G06K9/20;G06K9/46
代理公司: 陕西电子工业专利中心 61205 代理人: 王品华;朱红星
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 脱机 手写 维吾尔文 单词 字符 切分 方法
【说明书】:

技术领域

发明涉及一种数字图像处理方法,属于字符切分方法,可用于光 学字符识别中脱机手写维吾尔文单词的字符切分。

背景技术

随着手写字符识别应用领域不断扩展以及分类器识别能力的提高, 字符分割技术已经成为光学字符识别研究领域中的关键问题。实践表 明,字符切分不准确是产生误识别的主要原因之一,单字符正确识别率 的提高在很大程度上依赖于字符分割的准确性。

维吾尔文是我国一种重要的少数民族文字,属于阿尔泰语系突厥语 族西匈语支,仅在新疆地区就有900多万人使用维吾尔语进行交流和沟 通。开展维吾尔文识别的研究具有很高的理论价值和广阔的市场应用前 景。该技术的突破,对促进少数民族地区的信息化建设、促进民族和谐 发展,让少数民族群众共享信息化时代的丰硕成果等方面有重要意义。

目前,相对于中文、拉丁文、日文等主要文字识别系统的快速发展, 维吾尔文识别领域的发展明显滞后,尤其针对脱机手写维吾尔文识别研 究尚未见成熟报道。相比较与单字符识别,单词识别具有以下优势:(1) 更自然连贯的手写输入方式。人们在手写文字时,大部分都是以词为单 位在脑海中出现,如果将一个词中的字符逐个书写逐个识别,则很容易 影响思维的连贯性,因此,多字词的连续输入相对于单个字符逐个逐框 地输入更显得自然和人性化;(2)更快速的手写输入及识别方式。直接对 词进行书写识别,可以不用间断的将一个词输入,并进行单词整体识别。 目前,对于维吾尔文字符的识别已经有了一些研究成果,因此,如何将 单词中的字符正确切分出来,输入字符识别模块,是必须要解决的瓶颈 问题。由于包含了上下文信息,只要切分问题能处理的较好,则整词的 识别效果将优于字符的识别。

但是,由于维吾尔文单词无统一的高度、宽度,单词中存在字母间 前连、后连和前后连等情况,同时,连接方式不同的字母书写形式也不 同,这就造成一个单词中经常存在多个连通的伪词汇的现象,这种情况 在手写维吾尔文中更为突出。以上特点使得维吾尔单词的字符切分问题 变得很复杂,作为维吾尔文单词识别中关键步骤的字符切分,其目标就 是把含有手写单词的二值图像,切分为多个正确的二值化单字符图像。

目前,普遍采用的字符切分方法有:投影分析法、基于边缘跟踪的 方法、基于识别的方法、基于细化字符的方法、基于神经网络的方法、 基于形态学算子的方法等。其中:

投影分析法主要是利用字符串的垂直投影来检测切分点位置。如果 字符之间分离性比较好,字符间空隙的投影值将为零,在处理字体排列 整齐,规范,且质量较好的印刷体图像时,该方法简单、实用而且有效, 但是当手写文字书写复杂起来时,由于字符串之间互相搭粘,因而这种 简单的方法往往效果较差,无法解决问题。

基于边缘跟踪的方法,通过寻找轮廓线相对应的局部凹点来确定分 割路径,这是一类较有潜力的切分方法,但是如何有效地提取笔划信息 仍然有待于进一步研究。该类方法的缺点是计算复杂,效率较低,而且 对于字迹潦草的手写体,它们的笔划类别和边界往往难以准确定义,因 此取得的切分效果不理想。

基于识别的方法,这类方法主要的特点是利用识别结果来决定切分 结果,认为字符的切分应与字符识别紧密结合。但是,对于字符集较大 的识别,用该方法是一个很耗时的过程。如果用识别的结果来验证切分 的有效性,则取得速度和性能都比较好的切分效果将是相当困难的。

针对手写维吾尔文字符切分,上述几类方法同样存在以下困难,具 体表现在:

投影分析法的基本原理是利用字符串的垂直投影来检测切分点位 置,但是手写维吾尔文字往往出现笔画互相搭粘,附加字符位置偏移等 问题,无法准确定位出字符串垂直投影的局部极小点,或者会对字符产 生割裂切分等现象。

基于边缘跟踪的方法其缺点在于需要跟踪文字的轮廓线,手写维文 单词一般包含较多字符,书写不规范,采用此方法对笔画进行跟踪,计 算较复杂,相对于投影分析法效率偏低。

基于识别的方法需要根据识别结果确定切分结果,维文字符共32 个,具有128种变化形式,字符之间相似程度较高,如果将两者耦合, 用识别结果来验证切分的有效性,要取得速度和性能都比较好的切分效 果是比较困难的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010013727.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top