[发明专利]一种手写体藏文字丁识别方法在审
申请号: | 201810371572.9 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108764036A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 卢朝阳;赵晓艳;李静 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 藏文字 手写体 样本 样本库 联机 训练样本集 特征模板 特征向量 脱机信息 移动终端 识别率 可用 脱机 噪声 字典 分类 | ||
本发明提出了一种手写体藏文字丁识别方法,可充分利用手写体藏文字丁的联机和脱机信息,提高手写体藏文字丁的识别率,实现步骤为:(1)建立藏文字丁字典;(2)建立手写体藏文字丁样本库;(3)获取手写体藏文字丁样本库各样本的联机特征;(4)获取手写体藏文字丁样本库各样本的脱机特征;(5)获取不含噪声的藏文字丁样本的特征向量;(6)获取训练样本集和待识别样本;(7)获取藏文字丁样本的特征模板;(8)对待识别样本中的藏文字丁样本进行分类。本发明可用于对移动终端输入的手写体藏文字丁进行识别。
技术领域
本发明属于文字模式识别技术领域,涉及一种手写体藏文字丁识别方法,可用于对移动终端输入的手写体藏文字丁进行识别。
背景技术
藏语历史悠久,国内使用人口约为800万,目前英语与汉语识别技术已经成熟,并且广泛地应用在各领域,而藏语的识别技术还处于起步阶段,成果相对较少。伴随着各种移动设备的普及,手写输入成为人机交互的一种重要方式,藏语手写识别不仅具有重要的社会意义,还有广阔的市场前景。
藏语结构可分为两个部分:辅音字母和元音字母,这些字母按照藏语结构特点分别出现在藏语音节字的不同位置并进行叠加,字母之间的纵向叠加组成藏文字丁,字丁的横向叠加组成完整的藏文音节字。与藏文的字母和音节字相比,选取藏文字丁为识别对象的原因主要有以下几点:(1)字母之间相互粘连紧密,界定藏文字母十分困难。(2)藏文音节数量过于庞大,不但会对识别造成很大困扰,而且对于数据的采集,以现有条件来看也极为困难。(3)字丁在结构上是相互独立的,且参照《信息技术藏文编码字符集扩充集A》的编制说明:“在国际标准框架下制定藏文大字符集编码国家标准,定义垂直预组合的藏文字符,应作为我国藏文信息处理发展的策略”,因此选用藏文字丁作为识别单位是合理且便于实现国际化的。
目前,手写体藏文字丁的识别方法主要可分为基于脱机特征的识别方法和基于联机特征的识别方法。其中,基于脱机特征的识别方法处理的是由笔画轨迹点序列映射而成的二维图像,该方法对于手写输入经常出现的连笔、断笔和手写笔顺不同等问题有较好的鲁棒性,但是对于相似形如和等藏文的识别效果却差强人意。而基于联机特征的识别方法处理的是有时间信息的笔画轨迹点序列,该方法由于手写输入中会出现连笔、断笔、笔顺等书写不规范问题,从而使得笔画点序列发生了改变,对基于联机特征识别方法的识别效果产生很大干扰,但基于联机特征的识别方法对部分相似字丁的区分效果比基于脱机特征的识别方法更好。影响手写体藏文字丁识别率的因素主要有利用到的藏文文字特征信息不全面,藏文字丁本身相似度极高,以及手写文字的随意性造成的文字变形。目前已有技术中都是通过使用单一的脱机或联机识别技术来完成藏文的识别,并不能充分利用手写体藏文的脱机和联机信息,造成手写体藏文字丁的识别率低,而结合使用两种信息的手写体藏文识别方法却没有相关的文献或专利的报道。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种手写体藏文字丁识别方法,以提高手写体藏文字丁的识别率。
为实现上述目的,本发明采取的技术方案包括以下步骤:
(1)建立藏文字丁字典:
确定待采集藏文字丁的类别和类别数量n,并对确定的藏文字丁类别从0到n-1编码,得到n个带有编码的藏文字丁组成的藏文字丁字典,n≥2;
(2)建立手写体藏文字丁样本库:
(2a)在移动终端平台上采集m套手写体藏文字丁样本,每套样本包含藏文字丁字典中的所有类别,得到m×n个手写体藏文字丁样本;
(2b)对各手写体藏文字丁样本分别进行倾斜校正、平滑、归一化、插点和重采样,以去除采集过程中附加的噪声,得到由m×n个不含噪声的手写体藏文字丁样本组成的手写体藏文字丁样本库,其中,所述手写体藏文字丁样本为一系列按时序采样的笔画坐标轨迹,m≥2;
(3)获取手写体藏文字丁样本库各样本的联机特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810371572.9/2.html,转载请声明来源钻瓜专利网。