[发明专利]汉字的联机拉丁式草写输入与智能识别方法及系统在审

专利信息
申请号: 202010015971.9 申请日: 2020-01-08
公开(公告)号: CN111241984A 公开(公告)日: 2020-06-05
发明(设计)人: 黄同成;黄健钧;李平;胡俣华 申请(专利权)人: 邵阳学院
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06F17/14;G06N3/04
代理公司: 北京汇捷知识产权代理事务所(普通合伙) 11531 代理人: 张丽
地址: 422000 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 汉字 联机 拉丁 草写 输入 智能 识别 方法 系统
【权利要求书】:

1.汉字的联机拉丁式草写输入与智能识别方法及系统,其特征在于:具体步骤如下:步骤1:深度挖掘草体汉字信息,研制拉丁式草写曲体字库:以“字本位”核心理论为指导,根据当代草圣于右任先生的《标准草书》、张权的《标准草书要领》、孙庆昌的《草书新解》和周用全的《周用全行草字汇》等宝贵文献,基于数据挖掘技术透视中国草书的文化基因,认真开展草体汉字信息的深度挖掘,破译我国历代草书符号的基因密码,理顺汉字草书笔划的连接关系,理清汉字草化规律,以汉语系的“新眼光,新思路,新方法”来研究创新一套既实用于汉语人群又实用于非汉语人群、具有汉语特色的本体语言学的行之有效的拉丁式反草手写规则与方案,并研制形成汉字的拉丁式反草手写曲体字字库;汉字有独体字与合体字之分,独体字的拉丁式反草手写规则制订相对简单,只须根据标准草书直接深度挖掘即可;合体字有上下结构与左右结构之分,为了使它们被拉丁式草写后符合非汉语人群的拉丁文书写习惯,除了挖掘相应标准草体汉字信息之外,还须进行结构变换技术处理;

步骤2:拉丁式草写曲体文字便捷输入与智能认知算法:

(1)特征选取:特征提取是实现由一组特征所表示的字符的识别关键,特征提取的目标是获得二维图像到与图像信息密切相关的一维特征矢量XT(x1,...,xm)的映射,特征提取的目的是通过增加类间分离从而减少类内方差,特征提取包括两步:从归一化的特征坐标中提取相关特征的第一序列,计算这些特征的小波变换(WT)得出压缩形式的特征矢量,第一步共提取6个时域特征,前两个为x、y坐标本身,然后提取角度特征、方向和曲率,之所以提取角度特征,是因为它在平移和缩放时不会改变,这些时域特征的小波变换需分开进行,只有逼近系数才用来得出特征矢量;

前两个特征是X和Y坐标上的归一化值,在点x(t),y(t)上的局部书写方向用角α(t)的正弦和余弦表示,角α(t)是由连接前向节点和后向节点水平线形成的;

点x(t),y(t)的曲率或角度差用角θ(t)的正弦和余弦来描述,前向矢量沿着这个角逆时针旋转可与后向矢量重合,这是测量前向矢量和后向矢量之间角度差的方法,θ(t)可根据如下公式(1)、(2)与(3)计算:

Δy(t)=y(t+1)-y(t-1) (3)

可得:

小波变换根据逼近系数与细节系数表示信号,将原图像分解成4逼近子带和在水平、垂直和对角线方向的3细节子带,该过程不断迭代到预定层以获得该图像的多分辨率表示,其层数取决于应用到该图像的小波滤波器孔径反相大小,当小波变换需要从第一层到第二层两次采样时,应用小波变换的最大层值依赖于数据集中的数据点数,对于s×s像素的图像,其层次M与s的关系可表示为2M=s/2;

采用多分辨率的方法来进行特征生成,通过在局部、全局和中介三个阶段计算特征来生成特征实现动态字符识别,首先在粗分辨率中提取出特征,在接下来每次迭代中必须要考虑到子图像的高分辨率,直到所有的分类必须达到验收标准,使用3次小波滤波器,字符图像经过3尺度sym4小波分解后分解成为10个子带图像其中,子带图像表示字符图像的基本形状,可忽略。表示垂直高频分量或水平方向细节,表示水平高频分量或垂直细节;表示对角细节,然后,子带图像与子带图像相关联,从子带图像中提取小波相对能量分布特征,从细节图像分量中提取出链码直方图特征,的特征计算中,各自的绑定盒分为8×8块,并计算黑色像素的数量,连接和形成特征矢量;

(2)WNN:WNN(wavelet neural network(小波神经网络)为一种多层前馈网络,它以小波理论为基础,将离散小波函数作为节点的激活函数,WNN分类过程分为三步:第一步是网络初始化,第二步是利用梯度下降算法训练加权系数,最后一步是根据训练有素的加权系数实现特征分类,从图像应用的角度来看,小波网络可进一步分为一系列的阶段,WNN共有3层结构,分别为输入层上的nin个节点,隐藏层的nh个节点和输出层的nout个节点,选择Mexican hat小波作为基,它定义为表达式(7)

第k个输入神经元定义为式(8):

其中xj(j=1,2,…,nin,)是输入变量,Wj,k表示第i次输入与第k个隐藏节点连结线的权值,为了把握小波的级与位置,多尺度小波函数用作隐藏节点的转换函数,首隐藏节点的膨胀参数a设置为1,即ψ1,b1(x)=ψ(x-b1),第二隐藏节点的膨胀参数a设置2,即其中小波的输出结果被缩小为类似地,对于第j个隐藏节点的膨胀参数a设置为j,因此,WNN的隐藏层的输出可由式(9)给出:

第k个神经元的输出定义为式(10):

WNN的输出定义为式(11):

其中表示第k个隐藏节点与第一个输出节点连结线的权值,在训练中,通过式(12)调节权值、平衡与缩放参数以最小化误差T函数:

其中i=1,…,I是训练模式的数量,k=1,…,K是目标的数量,Dik和Oik分别表示Nodeik期望的输出值和激活网输出值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邵阳学院,未经邵阳学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010015971.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top