[发明专利]一种手写体藏文字丁识别方法在审
申请号: | 201810371572.9 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108764036A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 卢朝阳;赵晓艳;李静 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种手写体藏文字丁识别方法,可充分利用手写体藏文字丁的联机和脱机信息,提高手写体藏文字丁的识别率,实现步骤为:(1)建立藏文字丁字典;(2)建立手写体藏文字丁样本库;(3)获取手写体藏文字丁样本库各样本的联机特征;(4)获取手写体藏文字丁样本库各样本的脱机特征;(5)获取不含噪声的藏文字丁样本的特征向量;(6)获取训练样本集和待识别样本;(7)获取藏文字丁样本的特征模板;(8)对待识别样本中的藏文字丁样本进行分类。本发明可用于对移动终端输入的手写体藏文字丁进行识别。 | ||
搜索关键词: | 藏文字 手写体 样本 样本库 联机 训练样本集 特征模板 特征向量 脱机信息 移动终端 识别率 可用 脱机 噪声 字典 分类 | ||
【主权项】:
1.一种手写体藏文字丁识别方法,其特征在于,包括以下步骤:(1)建立藏文字丁字典:确定待采集藏文字丁的类别和类别数量n,并对确定的藏文字丁类别从0到n‑1编码,得到n个带有编码的藏文字丁组成的藏文字丁字典,n≥2;(2)建立手写体藏文字丁样本库:(2a)在移动终端平台上采集m套手写体藏文字丁样本,每套样本包含藏文字丁字典中的所有类别,得到m×n个手写体藏文字丁样本;(2b)对各手写体藏文字丁样本分别进行倾斜校正、平滑、归一化、插点和重采样,以去除采集过程中附加的噪声,得到由m×n个不含噪声的手写体藏文字丁样本组成的手写体藏文字丁样本库,其中,所述手写体藏文字丁样本为一系列按时序采样的笔画坐标轨迹,m≥2;(3)获取手写体藏文字丁样本库各样本的联机特征:根据不含噪声的藏文字丁样本的笔画坐标轨迹,计算每个藏文字丁样本在八个方向上的方向线素,得到m×n个藏文字丁样本的联机特征,其中,每个藏文字丁样本在八个方向上的方向线素,是指每个藏文字丁样本在平面直角坐标系中以x轴正方向为起点,逆时针方向旋转,每隔45度所指方向上的方向线素;(4)获取手写体藏文字丁样本库各样本的脱机特征:将每个不含噪声的藏文字丁样本的笔画坐标轨迹映射为二维图像,并对每个二维图像进行Gabor滤波,得到m×n个藏文字丁样本的脱机特征;(5)获取不含噪声的藏文字丁样本的特征向量:对每个藏文字丁样本的联机特征与脱机特征进行串行融合,得到m×n个藏文字丁样本的特征向量;(6)获取训练样本集和待识别样本:从手写体藏文字丁样本库中随机选取m‑1套藏文字丁样本,并将(m‑1)×n个藏文字丁样本作为训练样本集,剩余的n个藏文字丁样本作为待识别样本;(7)获取藏文字丁样本的特征模板:计算训练样本集中同一类别藏文字丁样本对应的特征向量的平均值,得到n个藏文字丁样本的特征模板;(8)对待识别样本中的藏文字丁样本进行分类:将待识别样本中n个藏文字丁样本对应的特征向量与每个藏文字丁样本的特征模板分别进行匹配,并参照藏文字丁字典,将匹配度最高的特征模板所属类别的编码对应的藏文字丁作为识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810371572.9/,转载请声明来源钻瓜专利网。