[发明专利]一种基于HMM-GMM的自动文字图片切分方法及系统在审
申请号: | 201510489963.7 | 申请日: | 2015-08-11 |
公开(公告)号: | CN105160342A | 公开(公告)日: | 2015-12-16 |
发明(设计)人: | 刘世林;何宏靖;陈炳章;吴雨浓 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hmm gmm 自动 文字 图片 切分 方法 系统 | ||
技术领域
本发明涉及图像识别领域,特别涉及一种基于HMM-GMM的自动文字图片切分方法及系统。
背景技术
随着视听设备的丰富,人们对图像识别技术的需求也在迅猛增长;在众多的图像识别技术中,对图像文字的识别技术显得尤为重要,这是因为图像文字往往比单纯图像包含更加重要的可利用信息,而且图像文字识别技术所应用的领域也很重要,比如说:银行签名的识别,交通管理网络中对于车牌号的追踪和识别,网络安全中对于验证码的识别;这些应用都关系到重要的经济活动或者社会管理活动。
而在进行文字图像识别时,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后将单个的文字图片送入分类器进行文字识别;传统的光学文字识别(OCR)系统进行文字切分最常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影密度找到两个文字之间的分界线。当图片没有噪音的情况下该方法非常简单易用,但是这种方法具有先天缺陷:无法很好的解决左右偏旁构建的汉字。为了解决左右结构的汉字图片切分文字,通常采用“切分-识别-合并”的方法或者设置文字尺寸阈值的方法来判断文字之间的切分点;这样方法计算复杂,切分效率低下;而且当图片存在无法很好去掉的噪音的时候,投影法将存在很大的误差,而这种情况是非常常见的;传统方法切分判断效率低下的主要原因还在于切分依据单一(垂直方向的投影密度,忽略了水平方向的重要信息)。
为了更好的对图片数据进行存储与分析,这就将产生大量的文字图片的识别需求。由于文字图片存在非常多的样式,比如文字的大小、字体、语言、噪音等,传统的OCR方法针对每一个新的识别任务,都需要开发一个新的工具进行文字图片切分,这将耗费大量的人力成本;严重的影响文字切分的效率;开发出针对特定任务的快速自动文字识别系统变得非常有意义。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种基于HMM-GMM的自动文字图片切分方法及系统。将待处理文字图片转换成时序数据,依次提取特征观测值序列O1.....T=[o1...oT];在提取出特征观测值序列的基础上,使用HMM-GMM对待处理文字图片中的每一字符进行序列建模,完成HMM模型训练;根据待识别文字图片的观测值序列O1.....L=[o1...oL],使用Viterbi算法计算出得到O1.....L=[o1...oL]概率最大的对应隐含状态序列S1...L,根据S1...L与HMM的对应关系找到文字图片的切分点;进而实现文字图片切分的自动化。本发明方法系统通过HMM-GMM将垂直信息和水平信息结合起来,得到文字切分的依据更加合理,同时选取的特征的不同能够得到不同文字切分依据,使得文字的切分依据更加多样化,有利于减小噪声污染对文字切分的不利影响;此外本发明方法使用HMM-GMM对文字切分的自动化程度较高,在图像文字识别中具有较高的普适性,显著的提高了文字图片的切分效率。
为了实现上述发明目的,本发明提供了以下技术方案:
一种基于HMM-GMM的自动文字图片切分方法,包含以下实现步骤:
(1)根据待识别文字图片所包含的字符集,选取对应的图片作为待处理子图片,并根据待处理子图片构建待处理文字图片,将待处理文字图片转换成时序特征的数据,并提取特征;
(2)对待处理文字图片中的每一字符构建对应的HMM,并使用GMM来估计HMM中的概率分布;
(3)根据待识别文字图片的大小构建相应的解码网络,提取待识别图片的观测值序列O1.....L=[o1...oL];使用Viterbi算法,找出概率最大的对应隐含状态序列S1...L;并根据此隐含状态序列与所述步骤(2)中字符的HMM对应关系,找出文字的切分点。
其中所述步骤(1)的具体实现过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510489963.7/2.html,转载请声明来源钻瓜专利网。