[发明专利]基于同构理论的字符识别方法、装置及终端设备有效
申请号: | 201810127075.4 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108345853B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 周恺卿;莫礼平;曾磊;曹良斌;刘笔余;江威;张轩宇 | 申请(专利权)人: | 吉首大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 梁香美 |
地址: | 416000 湖南省湘西*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同构 理论 字符 识别 方法 装置 终端设备 | ||
本发明实施例提供了一种基于同构理论的字符识别方法、装置及终端设备,该方法包括:获取字符图像,对其进行预处理;将预处理后的字符图像转换为与字符图像对应的结构图;对结构图中处于堆积状态的结点进行消除处理并对边进行合并;将经过消除处理后的结构图转换为曲线结构图;从获得的训练结果集合中提取出与待识别的曲线结构图同构的同构组;根据提取出的同构组获得与待识别的曲线结构图对应的匹配字符组;从获得的匹配字符组中选取出与曲线结构图的差异度最小的匹配字符,并将该匹配字符作为待处理的字符图像代表的字符。该字符识别方案通过字符图像转换、结点消除、同构检测以及差异度比较等过程实现字符图像的识别,提高了字符识别的准确度。
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种基于同构理论的字符识别方法、装置及终端设备。
背景技术
字符识别(Optical Character Recognition)是模式识别学科的一个重要研究领域。从五十年代开始,许多研究者就在这一领域开展了广泛的探索,推动了模式识别的发展。从输入设备来分,字符识别可分为联机识别和脱机识别,从输入字符的字体来分,脱机识别又可以分为印刷体识别和手写体识别,从对书写者的要求来分,手写体识别可分为限制性手写体识别和非限制性手写体识别。
非限制性手写体识别是这之中最难的也是最吸引人的,是人工智能中最有挑战性的问题之一,因为字符识别的复杂度因书写者书写的样式的变化迅速加大。
在联机手写体识别系统中,计算机在书写者输入的同时进行识别,最常用的输入设备是手写板,当笔在手写板表面上移动时产生一个坐标序列。比起脱机识别来说,联机识别中的某些性质使得联机识别相对于脱机识别容易一些,例如,联机识别中的包含笔画输入顺序的坐标序列、笔的起落、书写速度等均有助于识别。而脱机识别过程中待识别的字符不具备上述性质,导致脱机识别难度更大、识别结果不佳。因此,如何实现一种针对脱机识别的、识别精确度高的识别方案是本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于,提供一种基于同构理论的字符识别方法、装置及终端设备以解决上述问题。
本发明的较佳实施例提供一种基于同构理论的字符识别方法,所述方法包括:
获取待处理的字符图像,对所述字符图像进行预处理;
将预处理后的字符图像转换为与字符图像对应的结构图;
对所述结构图中处于堆积状态的结点进行消除处理,并在消除处理后进行边的合并;
将经过消除处理后的结构图转换为曲线结构图;
从获得的训练结果集合中提取出与待识别的曲线结构图同构的同构组;
根据提取出的同构组获得与待识别的曲线结构图对应的匹配字符组;
从获得的匹配字符组中选取出与所述曲线结构图的差异度最小的匹配字符,并将该匹配字符作为所述待处理的字符图像所代表的字符。
本发明的另一较佳实施例提供一种基于同构理论的字符识别装置,所述装置包括:
预处理模块,用于获取待处理的字符图像,对所述字符图像进行预处理;
第一转换模块,用于将预处理后的字符图像转换为与字符图像对应的结构图;
消除模块,用于对所述结构图中处于堆积状态的结点进行消除处理,并在消除处理后进行边的合并;
第二转换模块,用于将经过消除处理后的结构图转换为曲线结构图;
提取模块,用于从获得的训练结果集合中提取出与待识别的曲线结构图同构的同构组;
匹配字符组获取模块,用于根据提取出的同构组获得与待识别的曲线结构图对应的匹配字符组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉首大学,未经吉首大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810127075.4/2.html,转载请声明来源钻瓜专利网。