[发明专利]一种自然手写阿拉伯字母联机识别方法无效
申请号: | 200810121396.X | 申请日: | 2008-09-27 |
公开(公告)号: | CN101398902A | 公开(公告)日: | 2009-04-01 |
发明(设计)人: | 何加铭;闻建芬;贾德祥;陈静;陈平;马成臣;范周镒;丁洪珍;史智慧;史爱军;樊玲慧 | 申请(专利权)人: | 宁波新然电子信息科技发展有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 宁波奥圣专利代理事务所(普通合伙) | 代理人: | 程晓明 |
地址: | 315211浙江省宁波市风*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然 手写 阿拉伯 字母 联机 识别 方法 | ||
1.一种自然手写阿拉伯字母联机识别方法,其特征在于包括以下步骤:
①对输入终端设备的手写阿拉伯字母的笔迹坐标进行采集,并将采集到的笔迹坐标 实时存储到预先定义的结构体数组中;
②对存储在结构体数组中的笔迹坐标及由笔迹坐标转换成矩阵形式存放构成的笔 迹坐标点阵进行预处理,包括以下具体步骤:②-1、对存储在结构体数组中的笔迹坐标 进行平滑滤波、去除硬件噪声及手写时产生的毛刺和断笔;②-2、利用联机单点宽度手 写体的线性规一化和非线性规一化算法对由经过步骤②-1处理后的笔迹坐标转换成矩 阵形式存放构成的笔迹坐标点阵进行线性规一化和非线性规一化处理,得到新笔迹坐标 点阵,具体为:a1.采用公知的坐标框图比例缩放和直接投影的方法,将由经过步骤② -1处理后的笔迹坐标转换成矩阵形式存放构成的笔迹坐标点阵线性规一化到标准坐标 点阵;a2.将标准坐标点阵中的标准坐标点表示为(x,y),并将标准坐标点(x,y)划分成 非笔迹坐标点和笔迹坐标点;a3.计算标准坐标点(x,y)的密度函数d(x,y), 其中,Lx为当前所取标准坐标点的位置上的 横向密度,Ly为当前所取标准坐标点的位置上的竖向密度,A表示标准坐标点阵的长 度,其值为64;a4.根据标准坐标点(x,y)的密度函数d(x,y)计算标准坐标点(x,y)的水 平密度投影函数H(x)和垂直密度投影函数V(y),其中,d(x,y)为标准坐标点(x,y)的密度函数,I×J表示标准 坐标点阵的大小,其值为64×64,aH和av为矫正系数,其值均为0.1;a5.利用水平密 度投影函数H(x)和垂直密度投影函数V(y)进行非线性规一化,求取新笔迹坐标点阵, 其中,I×J表示标准坐标点阵的大小, 其值为64×64;M×N表示非线性规一化处理后得到的新笔迹坐标点阵的大小,其值预 先设定为64×64;(m,n)为新笔迹坐标点阵中的坐标点;i=1,2,…,I,j=1,2,…,J;② -3、对经过步骤②-2处理后得到的新笔迹坐标点阵中丢失的有效特征点进行补点操作;
③利用基于阿拉伯字母局部特征的逐级多层粗分类算法,首先根据阿拉伯字母的形 状特征,将所有标准阿拉伯字母分成四类,按输入的手写阿拉伯字母的笔划数直接得到 与该输入的手写阿拉伯字母匹配的第一候选字母集合;再根据输入的手写阿拉伯字母的 局部特征和第一候选字母集合,得到与该输入的手写阿拉伯字母匹配的第二候选字母集 合,局部特征包括字母的笔划数、字母的笔段数、字母的竖向穿越数、字母的横向穿越 数、字母中是否存在点笔划、点笔划的数目及点笔划所处位置;具体步骤为:③-1、第 一层粗分类:根据阿拉伯字母的形状特征,将所有标准阿拉伯字母分成case1类、case2 类、case3类和case4类四类,case1类包括笔划数为1笔的字母,case2类包括笔划数为 2笔的字母,case3类包括笔划数为3笔的字母,case4类包括笔划数为4笔的字母,按 输入的手写阿拉伯字母的笔划数直接得到与该输入的手写阿拉伯字母匹配的第一候选 字母集合;③-2、第二层粗分类:当第一候选字母集合与case1类相应时,对输入的手 写阿拉伯字母进行笔段分割,具体过程为:定义经过步骤②处理后得到的新笔迹坐标点 阵中表示输入的手写阿拉伯字母首笔划中的落笔的新笔迹坐标点为当前笔迹坐标点;判 断当前笔迹坐标点与与其相隔一个新笔迹坐标点的两新笔迹坐标点构成的夹角是否大 于设定的阈值,当夹角大于设定的阈值时,则确定当前笔迹坐标点为初步拐点;对下一 个新笔迹坐标点作同样的处理,得到所有的初步拐点;将所有初步拐点中正在处理的初 步拐点定义为当前初步拐点,将当前初步拐点相邻的两个初步拐点中与当前初步拐点之 间的矢量距离较近的一个初步拐点删除,直至所有的初步拐点处理完毕,得到所有优化 拐点;以优化拐点为界对输入的手写阿拉伯字母进行分割得到笔段;当分割得到的笔段 数为1时,直接得到该输入的手写阿拉伯字母匹配的第二候选字母集合;当分割得到的 笔段数大于1时,计算该输入的手写阿拉伯字母的竖向穿越数S,当S=1或S=2时,计 算该输入的手写阿拉伯字母的横向穿越数H,根据横向穿越数H得到该输入的手写阿拉 伯字母匹配的第二候选字母集合,当S=3时,根据该输入的手写阿拉伯字母的末笔划中 的提笔的走向得到该输入的手写阿拉伯字母匹配的第二候选字母集合,当S=4时,直接 得到该输入的手写阿拉伯字母匹配的第二候选字母集合;当第一候选字母集合与case2 类相应时,判断输入的手写阿拉伯字母的笔划中是否存在点笔划,如果存在点笔划,则 当点笔划的数目为1时,根据点笔划处于该输入手写阿拉伯字母的上方、下方或内部位 置,分别得到该输入的手写阿拉伯字母匹配的第二候选字母集合;当点笔划的数目为2 时,直接得到该输入的手写阿拉伯字母匹配的第二候选字母集合;如果不存在点笔划, 则再根据该手写阿拉伯字母是否为上下结构,分别得到该手写阿拉伯字母匹配的第二候 选字母集合;当第一候选字母集合与case3类相应时,判断输入的手写阿拉伯字母中除 点笔划之外的其他笔划是否首尾相连,如果首尾相连,则直接得到该输入的手写阿拉伯 字母匹配的第二候选字母集合,如果首尾不相连,再判断点笔划的位置,如果点笔划处 于该输入的手写阿拉伯字母的上方,则计算该输入的手写阿拉伯字母的竖向穿越数S, 当S=1或S=2时,计算该输入的手写阿拉伯字母的横向穿越数H,根据横向穿越H得 到该输入的手写阿拉伯字母匹配的第二候选字母集合,当S=3时,根据该输入的手写阿 拉伯字母的末笔划中的提笔的走向得到该输入的手写阿拉伯字母匹配的第二候选字母 集合,当S=4时,直接得到该输入的手写阿拉伯字母匹配的第二候选字母集合,如果点 笔划处于该手写阿拉伯字母的下方,则直接得到该输入的手写阿拉伯字母匹配的第二候 选字母集合;当第一候选字母集合与case4类相应时,计算输入的手写阿拉伯字母中除 点笔划之外的其他笔划的横向穿越数H,当横向穿越数H大于等于3时,直接得到该输 入的手写阿拉伯字母匹配的第二候选字母集合,当横向穿越数H小于3时,直接得到该 输入的手写阿拉伯字母匹配的第二候选字母集合;
④提取输入的手写阿拉伯字母的freeman链码,计算该输入的手写阿拉伯字母的 freeman链码与预先设定的字库中与第二候选字母集合中每个字母相应的各个标准字母 的最优隐马可夫模型的匹配概率,再从各个匹配概率中获取最大匹配概率,将预先设定 的字库中与最大匹配概率对应的标准字母确定为输入的手写阿拉伯字母的最终识别结 果。
2.根据权利要求1所述的一种自然手写阿拉伯字母联机识别方法,其特征在于所 述的步骤④包括以下具体步骤:④-1、提取输入的手写阿拉伯字母的freeman链码;④ -2、利用公知的Viterbi算法计算该输入的手写阿拉伯字母的freeman链码与预先设定的 字库中与第二候选字母集合中每个字母相应的各个标准字母的最优隐马可夫模型的匹 配概率;④-3、利用公知的冒泡排序法对计算得到的各个匹配概率进行排序,获取最大 匹配概率;④-4、将预先设定的字库中与最大匹配概率对应的标准字母确定为输入的手 写阿拉伯字母的最终识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波新然电子信息科技发展有限公司,未经宁波新然电子信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810121396.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于冷却超导体的多槽设备和方法
- 下一篇:杏切分去核生产工艺及机械化生产线