[发明专利]一种基于HMM-GMM的自动文字图片切分方法及系统在审

专利信息
申请号: 201510489963.7 申请日: 2015-08-11
公开(公告)号: CN105160342A 公开(公告)日: 2015-12-16
发明(设计)人: 刘世林;何宏靖;陈炳章;吴雨浓 申请(专利权)人: 成都数联铭品科技有限公司
主分类号: G06K9/34 分类号: G06K9/34
代理公司: 暂无信息 代理人: 暂无信息
地址: 610041 四川省成都市高新区*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 hmm gmm 自动 文字 图片 切分 方法 系统
【说明书】:

技术领域

发明涉及图像识别领域,特别涉及一种基于HMM-GMM的自动文字图片切分方法及系统。

背景技术

随着视听设备的丰富,人们对图像识别技术的需求也在迅猛增长;在众多的图像识别技术中,对图像文字的识别技术显得尤为重要,这是因为图像文字往往比单纯图像包含更加重要的可利用信息,而且图像文字识别技术所应用的领域也很重要,比如说:银行签名的识别,交通管理网络中对于车牌号的追踪和识别,网络安全中对于验证码的识别;这些应用都关系到重要的经济活动或者社会管理活动。

而在进行文字图像识别时,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后将单个的文字图片送入分类器进行文字识别;传统的光学文字识别(OCR)系统进行文字切分最常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影密度找到两个文字之间的分界线。当图片没有噪音的情况下该方法非常简单易用,但是这种方法具有先天缺陷:无法很好的解决左右偏旁构建的汉字。为了解决左右结构的汉字图片切分文字,通常采用“切分-识别-合并”的方法或者设置文字尺寸阈值的方法来判断文字之间的切分点;这样方法计算复杂,切分效率低下;而且当图片存在无法很好去掉的噪音的时候,投影法将存在很大的误差,而这种情况是非常常见的;传统方法切分判断效率低下的主要原因还在于切分依据单一(垂直方向的投影密度,忽略了水平方向的重要信息)。

为了更好的对图片数据进行存储与分析,这就将产生大量的文字图片的识别需求。由于文字图片存在非常多的样式,比如文字的大小、字体、语言、噪音等,传统的OCR方法针对每一个新的识别任务,都需要开发一个新的工具进行文字图片切分,这将耗费大量的人力成本;严重的影响文字切分的效率;开发出针对特定任务的快速自动文字识别系统变得非常有意义。

发明内容

本发明的目的在于克服现有技术中所存在的上述不足,提供一种基于HMM-GMM的自动文字图片切分方法及系统。将待处理文字图片转换成时序数据,依次提取特征观测值序列O1.....T=[o1...oT];在提取出特征观测值序列的基础上,使用HMM-GMM对待处理文字图片中的每一字符进行序列建模,完成HMM模型训练;根据待识别文字图片的观测值序列O1.....L=[o1...oL],使用Viterbi算法计算出得到O1.....L=[o1...oL]概率最大的对应隐含状态序列S1...L,根据S1...L与HMM的对应关系找到文字图片的切分点;进而实现文字图片切分的自动化。本发明方法系统通过HMM-GMM将垂直信息和水平信息结合起来,得到文字切分的依据更加合理,同时选取的特征的不同能够得到不同文字切分依据,使得文字的切分依据更加多样化,有利于减小噪声污染对文字切分的不利影响;此外本发明方法使用HMM-GMM对文字切分的自动化程度较高,在图像文字识别中具有较高的普适性,显著的提高了文字图片的切分效率。

为了实现上述发明目的,本发明提供了以下技术方案:

一种基于HMM-GMM的自动文字图片切分方法,包含以下实现步骤:

(1)根据待识别文字图片所包含的字符集,选取对应的图片作为待处理子图片,并根据待处理子图片构建待处理文字图片,将待处理文字图片转换成时序特征的数据,并提取特征;

(2)对待处理文字图片中的每一字符构建对应的HMM,并使用GMM来估计HMM中的概率分布;

(3)根据待识别文字图片的大小构建相应的解码网络,提取待识别图片的观测值序列O1.....L=[o1...oL];使用Viterbi算法,找出概率最大的对应隐含状态序列S1...L;并根据此隐含状态序列与所述步骤(2)中字符的HMM对应关系,找出文字的切分点。

其中所述步骤(1)的具体实现过程如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510489963.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top