[发明专利]基于计算机的依据字素分割的脱机手写维文单词识别方法有效
申请号: | 201810033760.0 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108090489B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 许亚美;徐志刚;何继爱;陈海燕;朱宁宁 | 申请(专利权)人: | 兰州理工大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 兰州振华专利代理有限责任公司 62102 | 代理人: | 董斌 |
地址: | 730050 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 计算机 依据 分割 脱机 手写 维文 单词 识别 方法 | ||
1.基于计算机的依据字素分割的脱机手写维文单词识别方法,其步骤为:
步骤1、根据维吾尔文字的形态结构和书写规则,建立维吾尔单词字素库;
步骤2、对采集到的脱机手写维文单词图像进行预处理;
步骤3、对步骤2预处理后的手写维文单词图像,以字素为单位进行分割,得到三个脱机手写维文字素序列;
步骤4、对步骤3获得的不同字素序列中的字素,设计不同的特征提取和分类器,分类识别后获得识别距离,再将识别距离转化为字素识别置信度;
步骤5、构建单词的字素贝叶斯网络模型,包括字素、连体段和单词的状态节点,并提供该模型网络结构的规整方法;
步骤6、通过步骤5所述的单词贝叶斯网络模型,输入步骤4所得字素识别置信度,推理计算待测样本至维文单词类别的识别置信度,得到单词识别结果;
其特征在于,步骤5所述的单词贝叶斯网络模型的构建包括:
(5-1)单词的贝叶斯网络建模:针对维文单词分割产生的字素序列,通过贝叶斯网络构建单词、连体段和字素之间的三级匹配模型,其中包括单词、连体段和字素等状态节点,并以有向弧表示状态节点之间的转移概率;
(5-2)贝叶斯网络模型的参数估计:所含的模型参数包括状态转移概率和字素识别概率:
(5-2-1)对于状态转移概率,有表示组成关系和表示字素联系两类,表示组成关系的状态转移概率由状态节点之间的构成关系确定,表示字素间联系的状态转移概率,可根据维吾尔文语料库进行词频数据统计得到;
(5-2-2)对于字素识别概率,即字素识别置信度;
(5-3)贝叶斯网络模型的结构规整:由于单词所包含连体段、字素的数目不定,为计算待识样本至单词类别的识别置信度,利用空字素Φ来规整贝叶斯网络模型至规定结构。
2.根据权利要求1所述的基于计算机的依据字素分割的脱机手写维文单词识别方法,其特征是:单词贝叶斯网络模型构建,(5-1)所述的单词贝叶斯网络模型包括:
(5-1-1)状态节点:根据单词由连体段组成、连体段由字素组成的规则,所有状态节点分为字素、连体段、单词三类并依次呈因果关系;
(5-1-2)状态转移概率:表述状态节点之间发生的因果关系,可分为两类,一类是表示字素、连体段、单词之间组成关系的转移概率,另一类是表示字素之间联系的转移概率;
(5-1-3)样本特征和字素识别概率:样本特征表述待测单词样本的字素特征,包括主体字素、点字素和附加字素三个序列;字素识别概率即字素识别置信度。
3.根据权利要求1所述的基于计算机的依据字素分割的脱机手写维文单词识别方法,其特征是:单词识别过程,步骤6所述的维文单词识别置信度计算的具体方法:
设待测单词样本的字素特征为:
其中G=M,D,A代表主体、点、附加三类字素,表示第i个连体段中的第j个主体字素及对应的点和附加字素,于是,待测样本X至单词类别WI的识别置信度p(WI|X)按下式计算:
其中,Pa(·)表示状态节点的父节点集,有,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州理工大学,未经兰州理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810033760.0/1.html,转载请声明来源钻瓜专利网。