[发明专利]一种手写体藏文字丁识别方法在审
申请号: | 201810371572.9 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108764036A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 卢朝阳;赵晓艳;李静 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 藏文字 手写体 样本 样本库 联机 训练样本集 特征模板 特征向量 脱机信息 移动终端 识别率 可用 脱机 噪声 字典 分类 | ||
1.一种手写体藏文字丁识别方法,其特征在于,包括以下步骤:
(1)建立藏文字丁字典:
确定待采集藏文字丁的类别和类别数量n,并对确定的藏文字丁类别从0到n-1编码,得到n个带有编码的藏文字丁组成的藏文字丁字典,n≥2;
(2)建立手写体藏文字丁样本库:
(2a)在移动终端平台上采集m套手写体藏文字丁样本,每套样本包含藏文字丁字典中的所有类别,得到m×n个手写体藏文字丁样本;
(2b)对各手写体藏文字丁样本分别进行倾斜校正、平滑、归一化、插点和重采样,以去除采集过程中附加的噪声,得到由m×n个不含噪声的手写体藏文字丁样本组成的手写体藏文字丁样本库,其中,所述手写体藏文字丁样本为一系列按时序采样的笔画坐标轨迹,m≥2;
(3)获取手写体藏文字丁样本库各样本的联机特征:
根据不含噪声的藏文字丁样本的笔画坐标轨迹,计算每个藏文字丁样本在八个方向上的方向线素,得到m×n个藏文字丁样本的联机特征,其中,每个藏文字丁样本在八个方向上的方向线素,是指每个藏文字丁样本在平面直角坐标系中以x轴正方向为起点,逆时针方向旋转,每隔45度所指方向上的方向线素;
(4)获取手写体藏文字丁样本库各样本的脱机特征:
将每个不含噪声的藏文字丁样本的笔画坐标轨迹映射为二维图像,并对每个二维图像进行Gabor滤波,得到m×n个藏文字丁样本的脱机特征;
(5)获取不含噪声的藏文字丁样本的特征向量:
对每个藏文字丁样本的联机特征与脱机特征进行串行融合,得到m×n个藏文字丁样本的特征向量;
(6)获取训练样本集和待识别样本:
从手写体藏文字丁样本库中随机选取m-1套藏文字丁样本,并将(m-1)×n个藏文字丁样本作为训练样本集,剩余的n个藏文字丁样本作为待识别样本;
(7)获取藏文字丁样本的特征模板:
计算训练样本集中同一类别藏文字丁样本对应的特征向量的平均值,得到n个藏文字丁样本的特征模板;
(8)对待识别样本中的藏文字丁样本进行分类:
将待识别样本中n个藏文字丁样本对应的特征向量与每个藏文字丁样本的特征模板分别进行匹配,并参照藏文字丁字典,将匹配度最高的特征模板所属类别的编码对应的藏文字丁作为识别结果。
2.根据权利要求1所述的一种手写体藏文字丁识别方法,其特征在于,步骤(2b)中所述的归一化,是指将手写体藏文字丁样本库中各藏文字丁样本在水平和垂直的两个方向上分别进行线性缩放,并调整每个藏文字丁样本笔画坐标轨迹的密度和重心位置,以实现藏文字丁样本笔画的均匀化。
3.根据权利要求1所述的一种手写体藏文字丁识别方法,其特征在于,步骤(5)中所述的对每个藏文字丁样本的联机特征与脱机特征进行串行融合,其表达式为:
D=λa×Dα+λb×Dβ
其中,D是融合特征,Dα是联机特征,Dβ是脱机特征,λa是联机特征的加权系数,λb是脱机特征的加权系数。
4.根据权利要求1所述的一种手写体藏文字丁识别方法,其特征在于,步骤(8)中所述的将待识别样本中n个藏文字丁样本对应的特征向量与每个藏文字丁样本的特征模板进分别行匹配,采用欧式距离分类器,欧式距离的计算公式为:
其中,p为特征向量的维数,xi是待识别藏文字丁样本的第i维特征向量的值,yi为某类藏文字丁样本第i维特征模板的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810371572.9/1.html,转载请声明来源钻瓜专利网。