[发明专利]基于HMM和决策树的阿拉伯语光学字母识别方法有效
申请号: | 201510420294.8 | 申请日: | 2015-07-17 |
公开(公告)号: | CN105023028B | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 尤新革;罗特飞 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种阿拉伯语光学字母识别方法,包括以下步骤:接收包含阿拉伯语文本的输入图像,通过检测所述输入图像中每个读音符号的边界框、并将其坐标与文本主体的边界框坐标比较去除所有读音符号,将每个输入图像划分为四层,并对所述四层执行特征提取,将特征提取的结果输入隐马尔可夫模型,以生成表示每个阿拉伯语字母的隐马尔可夫模型,对生成的表示每个阿拉伯语字母的隐马尔可夫模型进行迭代训练,直至满足似然比准则为止,将迭代训练后的隐马尔可夫模型输入决策树,以预测读音符号的位置和类别,并生成最终识别结果。本发明能够利用阿拉伯语的书写特性使识别任务更简单,并具有较高的识别精度。 | ||
搜索关键词: | 阿拉伯语 隐马尔可夫模型 读音符号 输入图像 迭代训练 特征提取 字母识别 边界框 输入决策 文本主体 坐标比较 决策树 似然比 去除 文本 书写 检测 预测 | ||
【主权项】:
1.一种基于HMM和决策树的阿拉伯语光学字母识别方法,其特征在于,包括以下步骤:(1)接收包含阿拉伯语文本的输入图像;(2)通过检测所述输入图像中每个读音符号的边界框、并将其坐标与文本主体的边界框坐标比较去除所有读音符号;(3)将每个输入图像划分为四层,并对所述四层执行特征提取;(4)将特征提取的结果输入隐马尔可夫模型,以生成表示每个阿拉伯语字母的隐马尔可夫模型;(5)对生成的表示每个阿拉伯语字母的隐马尔可夫模型进行迭代训练,直至满足似然比准则为止;(6)将迭代训练后的隐马尔可夫模型输入决策树,以预测读音符号的位置和类别,并生成最终识别结果;其中,对所述四层执行特征提取的过程包括以下子步骤:提取第一特征,其等于包含黑色像素的层的数量;提取第二特征,其等于第一层和第四层和的均值;提取第三特征,其等于第二层和第三层和的均值;提取第四、第五和第六特征,其等于所有四层垂直投影的和;提取第七、第八和第九特征,其等于第三层垂直投影。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510420294.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种通过二维码进行画作信息管理的方法
- 下一篇:基于主动视觉的车标定位方法