[发明专利]一种金融OCR系统手写体数字串的软切分方法无效
申请号: | 201110436948.8 | 申请日: | 2011-12-23 |
公开(公告)号: | CN102567725A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 丁杰;彭林;朱力鹏;胡斌 | 申请(专利权)人: | 国网电力科学研究院 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 汪旭东 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金融 ocr 系统 手写体 字串 切分 方法 | ||
技术领域
本发明属于OCR技术领域,涉及一种手写体字符串的切分方法,该方法可以通过对数字图像中笔划进行模糊特征抽取,并映射到特征片段集,在此基础上形成候选的切分假设和计算出最优的切分结果。
背景技术
目前OCR已成为多种系统的核心技术,得到广泛的运用并涉及从金融、政府、图书馆到电力、企事业单位等众多行业领域,如文档影像识别系统(包括文档录入、搜索、管理等)、办公室自动化的文本输入、邮政编码自动分拣系统、文档自动分类系统、车牌自动识别系统、票据自动处理系统等。一个完整的OCR系统一般需要以下几个步骤:倾斜图像的调整、版面分析和版面理解、字符串切分、字符识别以及必要的后处理。在上述OCR技术体系中,字符串切分技术一直是OCR应用软件研究的热点和难点。字符切分技术主要解决字符间位置关系的四种形式,即孤立、粘连、交错以及交叠:孤立是指字符之间各自分开,独立成为整体;粘连是指两字符笔划有一处或多处接触;交错是指两字符在水平方向上的投影有重叠,但字符间没有实际的粘连;交叠是指两字符共享某一块像素区域,即所谓的共用笔划。由于笔划相互粘连是造成手写数字串切分困难的重要原因,而对粘连字符识别不准确是产生识别错误的主要原因,现阶段研究对此展开。
本发明的研究基础主要包括以下三个方面:
(1)图像预处理。字符图像的预处理是字符分割和识别的前提和基础,主要针对采集脱机手写字符过程中存在的干扰信号,如纸张本身带有的污点或扫描设备性能问题等,特别是由于书写时用力不均、字体潦草等造成的字符笔划断裂和粗细不均,进行图像的规整和优化,从而避免影响切分和识别的效果。图像预处理技术通常包括图像平滑滤波技术、二值化技术等。
(2)主曲线分析。主曲线是通过数据分布“中间”并满足“自相合”的光滑曲线,曲线上的每一点是投影至该点的数据点的条件均值。主曲线的理论基础是寻求嵌入高维空间的非欧氏低维流形,继承了主成分分析的众多思想,是线性主成分的非线性推广,能够真实地反映数据的形态,即曲线是数据集合的“骨架”。主曲线具有对数据信息保持性好的优点,可以在图像细化过程中最大限度地保护特征细节不丢失和细化图谱的光滑性。
(3)分类器组合和置信度修正。多分类器组合是设计一个高性能,且稳定的手写体数字识别器的有效途径,一定程度上克服了导致分类器性能不佳的三类原因:单特征对字符本质反映不全面;噪声等因素的影响,导致特征对字符描述的不稳定;不同类型分类器对特征变化的敏感性和稳定性不同导致单分类器性能下降。一般认为,不同性质的特征往往描述字符模式的不同方面,在一种特征空间很难区分的两种模式可能在另一种特征空间上很容易分开,而对应于同一特征的不同分类器又从不同的角度(基于概率或最近距离等)将该特征映射到结果集合上,因此往往使用后验概率对分类器组合的置信度进行修正。
发明内容
本发明针对无限制手写体数字串的切分问题,提出了一种基于识别的切分方法。将数字串看成数字笔划的集合,依据主曲线分析抽取数字笔划。为克服抽取笔划的不规则和集合存在冗余的缺陷,提出了适于数字笔划处理的模糊规则对抽取笔划进行分裂、合并和筛选,生成适合笔划组合的笔划集合。候选切分假设依据笔划组合过程生成,文中将笔划集合中各笔划在水平方向上进行排序形成笔划序列,从而通过划分笔划序列为子序列集的方式生成候选切分假设,每个子序列对应于一个字符模式。在此基础上使用组合分类器对各子序列进行识别输出,生成最优的切分假设作为切分结果输出。总体结构见图1。
附图说明
图1总体流程框图。
图2是图像预处理的平滑窗口模板。
图3是笔划模糊特征对应的模糊函数取值。
图4是笔划分裂点遍历的示意图。
图5是笔划组合及识别的示意图。
图6是笔划组合步骤的一个典型示例图。
具体实施方式
(1)图像预处理
由于在图像采集过程中噪声干扰不可避免,容易造成一些孤立小块或字符边缘出现不规则的锯齿和噪声,因此经Otsu二值化后的字符图像还不能直接使用。针对字符笔划上的毛刺、凹陷以及孤立噪声点,首先以字符图像的平均笔划宽度为依据对图像进行滤波处理,但要避免平滑掉过细的笔划部分,然后逐行扫描二值字符图像,并依据给定大小窗口内的图像结构细节修改中心像素值,以便剔除笔划上的毛刺、填平笔划上的凹陷或内孔,并抑制或消除噪声对字符切分的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电力科学研究院,未经国网电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110436948.8/2.html,转载请声明来源钻瓜专利网。