[发明专利]一种简易的印刷体数字识别方法有效
申请号: | 201810210106.2 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108549889B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 魏祥灰;王彪;姚振楠;唐超颖 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 简易 印刷体 数字 识别 方法 | ||
本发明提供了一种简易的印刷体数字识别方法,属于图像处理技术领域。该方法包括数字检测、数字分类以及决策机制三部分:首先,获取数字图像,以亮度、区域面积、长宽比为特征检测数字区域;然后,根据获得的数字区域,利用数字的封闭特性、直方图特性将其粗分类为四部分,结合数字的穿线特征、局部直方图特征以及局部封闭性特征再对其进行细分类,进而识别各数字;最后,利用滤波与状态机结合的决策机制,提高数字识别的准确度,达到准确识别数字的目的。本发明通过设计分类决策树与决策机制并应用数字框,提高识别的准确性和鲁棒性,实现简易而准确的印刷体数字识别方法,具有很大的实用价值。
技术领域
本发明涉及一种简易的印刷体数字识别方法,属于图像处理技术领域。
背景技术
如今对印刷体数字的识别已经得到了广泛的应用,如何简单、高效且准确地实现印刷体数字的识别是目前各种印刷体数字识别方法接下来面临的挑战。
现有的印刷体数字识别方法主要有三类:基于模版匹配的数字识别方法、基于人工神经网络的数字识别方法以及基于特征分析的数字识别方法。
传统的识别方法是模板匹配,该方法的主要问题在于计算量大、对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感;基于人工神经网络的数字识别方法是当前最为流行的方法,该方法适用于环境复杂、难以提取特征的情况,对处理器要求较高,需要较大的存储空间以及运行内存,不适用于印刷体数字的识别问题;基于特征分析的方法通过提取号码图像中的具有代表性的特征达到识别该数字的目的,当前研究中的数字特征主要有:焦点特征、封闭半封闭特征、横竖直线特征、投影特征以及分区面积特征等等,但是这些特征鲁棒性不够,受数字字体、倾斜度等因素影响程度不一,直接影响到实际应用中数字识别的准确率。
发明内容
为解决现有技术存在的问题,本发明提出一种简易的印刷体数字识别方法,该识别方法鲁棒性强,准确度高。
本发明为解决现有问题的技术方案为:
一种简易的印刷体数字识别方法,包括如下步骤:
(一)数字检测
为数字增加一个合作的方框将数字包围起来,数字外框与数字的高度之比为2:1,宽度之比为3:1,数字内外框的厚度为外框宽度的1/6,其中数字与外框为黑色白底;
检测算法的具体流程如下:
(1)通过图像采集得到RGB图像,由公式(1)得到图像亮度
Y=((R*299)+(G*587)+(B*114))/100 (1)
设定固定阈值为150,对图像亮度做二值化处理;
(2)利用数字外框与数字的面积比特征、几何关系特征以及数字和数字外框的高宽比作为特征量筛选出经二值化处理的图像中的方框与对应的数字区域;
(3)由数字外框的最左、最右、最上以及最下点确定方框的四个角点,相邻位置连线的斜率表示方框旋转的角度,对截取到的数字图像做旋转矫正;
(二)数字分类
数字分类的算法流程为:
(1)根据上述数字检测三个步骤步骤获得的旋转矫正后的数字图像,得到数字的最小外接矩形,计算在矩形方框内的竖直投影直方图,如果直方图中存在大于数字区域高度90%的值,则数字是1或4;
(2)若数字不是1或4,在竖直1/2的位置获取数字的封闭特征矢量K1,若K1的维数是0,则该数字是0或8;若K1的维数是1,则该数字是2、3、6、7或9;若K1的维数是2,则该数字是2或5;
(3)对数字1和4的区分流程:水平1/3穿线得到交点个数,如果交点数大于3,则该数字是4,反之数字为1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810210106.2/2.html,转载请声明来源钻瓜专利网。