[发明专利]基于计算机的依据字素分割的脱机手写维文单词识别方法有效

专利信息
申请号: 201810033760.0 申请日: 2018-01-15
公开(公告)号: CN108090489B 公开(公告)日: 2021-06-29
发明(设计)人: 许亚美;徐志刚;何继爱;陈海燕;朱宁宁 申请(专利权)人: 兰州理工大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/46;G06K9/62
代理公司: 兰州振华专利代理有限责任公司 62102 代理人: 董斌
地址: 730050 甘肃*** 国省代码: 甘肃;62
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 计算机 依据 分割 脱机 手写 维文 单词 识别 方法
【权利要求书】:

1.基于计算机的依据字素分割的脱机手写维文单词识别方法,其步骤为:

步骤1、根据维吾尔文字的形态结构和书写规则,建立维吾尔单词字素库;

步骤2、对采集到的脱机手写维文单词图像进行预处理;

步骤3、对步骤2预处理后的手写维文单词图像,以字素为单位进行分割,得到三个脱机手写维文字素序列;

步骤4、对步骤3获得的不同字素序列中的字素,设计不同的特征提取和分类器,分类识别后获得识别距离,再将识别距离转化为字素识别置信度;

步骤5、构建单词的字素贝叶斯网络模型,包括字素、连体段和单词的状态节点,并提供该模型网络结构的规整方法;

步骤6、通过步骤5所述的单词贝叶斯网络模型,输入步骤4所得字素识别置信度,推理计算待测样本至维文单词类别的识别置信度,得到单词识别结果;

其特征在于,步骤5所述的单词贝叶斯网络模型的构建包括:

(5-1)单词的贝叶斯网络建模:针对维文单词分割产生的字素序列,通过贝叶斯网络构建单词、连体段和字素之间的三级匹配模型,其中包括单词、连体段和字素等状态节点,并以有向弧表示状态节点之间的转移概率;

(5-2)贝叶斯网络模型的参数估计:所含的模型参数包括状态转移概率和字素识别概率:

(5-2-1)对于状态转移概率,有表示组成关系和表示字素联系两类,表示组成关系的状态转移概率由状态节点之间的构成关系确定,表示字素间联系的状态转移概率,可根据维吾尔文语料库进行词频数据统计得到;

(5-2-2)对于字素识别概率,即字素识别置信度;

(5-3)贝叶斯网络模型的结构规整:由于单词所包含连体段、字素的数目不定,为计算待识样本至单词类别的识别置信度,利用空字素Φ来规整贝叶斯网络模型至规定结构。

2.根据权利要求1所述的基于计算机的依据字素分割的脱机手写维文单词识别方法,其特征是:单词贝叶斯网络模型构建,(5-1)所述的单词贝叶斯网络模型包括:

(5-1-1)状态节点:根据单词由连体段组成、连体段由字素组成的规则,所有状态节点分为字素、连体段、单词三类并依次呈因果关系;

(5-1-2)状态转移概率:表述状态节点之间发生的因果关系,可分为两类,一类是表示字素、连体段、单词之间组成关系的转移概率,另一类是表示字素之间联系的转移概率;

(5-1-3)样本特征和字素识别概率:样本特征表述待测单词样本的字素特征,包括主体字素、点字素和附加字素三个序列;字素识别概率即字素识别置信度。

3.根据权利要求1所述的基于计算机的依据字素分割的脱机手写维文单词识别方法,其特征是:单词识别过程,步骤6所述的维文单词识别置信度计算的具体方法:

设待测单词样本的字素特征为:

其中G=M,D,A代表主体、点、附加三类字素,表示第i个连体段中的第j个主体字素及对应的点和附加字素,于是,待测样本X至单词类别WI的识别置信度p(WI|X)按下式计算:

其中,Pa(·)表示状态节点的父节点集,有,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州理工大学,未经兰州理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810033760.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top