[发明专利]一种从视频图像中分割字符的方法和装置有效

申请号：	200810114319.1	申请日：	2008-06-03
公开（公告）号：	CN101599124A	公开（公告）日：	2009-12-09
发明（设计）人：	黄磊;刘昌平;程豪	申请（专利权）人：	汉王科技股份有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/72
代理公司：	北京集佳知识产权代理有限公司	代理人：	逯长明
地址：	100193北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频图像分割字符方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及视频字符识别领域，特别涉及一种从视频图像中分割字符的方法以及一种从视频图像中分割字符的装置。

背景技术

视频图像中的字符作为一种高级语义特征，对视频内容的理解、索引等具有重要作用。然而，由于视频图像的分辨率不高、视频图像中字符对应的背景复杂、干扰较大；并且，传统的OCR系统只能接受二值化的文本图像，因此，从视频图像的复杂背景中准确地分割出字符，是视频字符识别领域研究的重要课题之一。

现有技术中，在视频中分割出字符的方法主要包括以下三类：

第一类，基于阈值的方法：

具体可以参考由V.Wu，R.Manmatha，E.M.Riseman.1999年在IEEE Trans.on Pattern Analysis and Machine Intelligence第21卷第11期上发表的文献：一种从图像中检测和辨识文本的自动系统(An AutomaticSystem to Detect and Recognize Text in Images)中第1224-1229页的内容。这类方法利用局部阈值来去除背景和噪声，同时得到二值化的图像。由于这种基于颜色阈值的方法最早来源于灰度成双峰分布的文档图像分析，所以无法处理背景复杂的视频文字图像。

第二类，基于颜色模型的方法：

具体可以参考由D.Chen，J.-M.Odobesz，H.Bourlard 2002年在Proceedings of International Conference on Pattern Recognition上发表的文献：基于马尔科夫随机场模型从复杂背景中分割和辨识文本(Textsegmentation and recognition in complex background based on markovrandom field)中第227-230页的内容。这类方法首先学习了文字前景像素的高斯混合模型GMMs，接着使用马尔科夫随机场模型分割前景和背景。这种方法考虑了颜色信息和字符的空域信息，是一种较好的分割方法，但需要使用监督学习建立前景像素的颜色模型，这将给使用者带来额外的负担和不便。而且，这类方法中颜色模型的建立依赖于样本点的选取，然而在视频图像的复杂背景中，分析出字符的颜色分布情况是比较困难的。

第三类，基于连通体分析的方法：

具体可以参见由Yaowen Zhan，Weiqiang Wang，Wen Gao 2006年在Proceedings of International Conference on Pattern Recognition上发表的文献：一种用于图像的连通体文本分割方法(A Robust Split-and-MergeText Segmentation Approach for Images)中第1002-1005页的内容。这类方法通过选择文本框边界的点作为种子，使用种子生长法去除与边界相连的连通体，这种方法对于质量较好的图像，能够取得较好的效果，但当对比度很低，或者文字与背景同色，文字外边缘的边框不封闭的情况，文字颜色层图像中笔画区域与背景区域会发生粘连，在连通域分析中，种子填充算法会将文字侵蚀。因此，这种连通体分析的方法对于复杂背景，低分辨率，和受噪声干扰的视频图像仍不适用。

因而，本领域技术人员迫切需要发展出一种创新的视频图像文字分割机制，用以从复杂背景的视频图像中准确地分割出字符，从而提高视频图像中字符识别的准确性。

发明内容

本发明所要解决的技术问题是提供一种可以从视频图像中分割字符的方法，使用该方法无需机器学习，计算量小，性能好，可以快速、准确地从复杂背景的视频图像中准确地分割出字符。

本发明还提供了一种从视频图像中分割字符的装置，用以保证上述方法在实际中的实现及应用。

为解决上述技术问题，本发明实施例公开了一种从视频图像中分割字符的方法，包括：

在视频图像中定位原始字符图像；

从所述原始字符图像中抽取字符笔画信息，并二值化所述字符笔画信息，获得所述原始字符图像的二值笔画图；

针对所述二值笔画图中的字符区域建立颜色模型，并依据所述颜色模型提取所述字符区域的颜色层图像；

生成所述原始字符图像的笔画掩码图，依据所述笔画掩码图去除所述颜色层图像的多余背景。

优选的，所述的方法，还包括：

对所述颜色层图像进行去噪处理。

优选的，所述生成原始字符图像的二值笔画图的步骤进一步包括：