[发明专利]一种视频OCR图文分离方法及系统有效
申请号: | 200810113659.2 | 申请日: | 2008-05-29 |
公开(公告)号: | CN101593276A | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 禹晶;黄磊;刘昌平 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/40;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 100193北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 ocr 图文 分离 方法 系统 | ||
1.一种图文分离方法,其特征在于,包括:
对双边模型进行改进,使提取预设宽度范围内的文本笔画;
利用所述改进的双边模型,从原始文本图像中提取笔画图像;
将所述提取出的笔画图像转换为二值图像;
将所述二值图像进行去噪处理,包括:
对所述原始文本图像进行边缘检测,再对边缘包围的孔洞进行填充,得到模板;
将所述模板与所述二值图像进行“与”运算,提取出所述二值图像中对应模板位置的像素,得到去除噪声后的文本笔画。
2.根据权利要求1所述的方法,其特征在于,将所述提取出的笔画图像转换为二值图像的步骤包括:
对所述提取出的笔画图像选取两级阈值,得到相应的低阈值二值图像和高阈值二值图像;
循环扫描高阈值二值图像中的像素,当扫描到笔画对应的像素时,将低阈值二值图像中对应位置的像素作为种子点,在所述低阈值二值图像中,从该种子点开始寻找连通分量;
当对高阈值二值图像中的像素都扫描完后,从所述低阈值二值图像中提取出的连通分量即为转换后的二值图像。
3.根据权利要求2所述的方法,其特征在于,在高阈值二值图像中扫描到笔画对应的像素时,还包括:
从该像素开始在所述高阈值二值图像中寻找连通分量,并将连通分量的像素标记为已扫描。
4.根据权利要求1所述的方法,其特征在于,对所述原始文本图像进行边缘检测之后,对边缘包围的孔洞进行填充之前,还包括:
对检测结果进行边缘连接。
5.根据权利要求1所述的方法,其特征在于,从原始文本图像中提取笔画图像之前,还包括:
对所述原始文本图像进行图像增强。
6.一种图文分离系统,其特征在于,包括:
模型建立单元,用于对双边模型进行改进,使提取预设宽度范围内的文本笔画;
笔画提取单元,用于利用所述改进的双边模型,从原始文本图像中提取笔画图像;
二值化单元,用于将所述提取出的笔画图像转换为二值图像;
去噪单元,用于将所述二值图像进行去噪处理,所述去噪单元进一步包括:
模板建立子单元,用于对所述原始文本图像进行边缘检测,再对边缘包围的孔洞进行填充,得到模板;
去噪子单元,用于将所述模板与所述二值图像进行“与”运算,提取出所述二值图像中对应模板位置的像素,得到去除噪声后的文本笔画。
7.根据权利要求6所述的方法,其特征在于,所述二值化单元进一步包括:
两级全局阈值子单元,用于对所述提取出的笔画图像选取两级阈值,得到相应的低阈值二值图像和高阈值二值图像;
连通分量提取子单元,用于循环扫描高阈值二值图像中的像素,当扫描到笔画对应的像素时,将低阈值二值图像中对应位置的像素作为种子点,在所述低阈值二值图像中,从该种子点开始寻找连通分量;当对高阈值二值图像中的像素都扫描完后,从所述低阈值二值图像中提取出的连通分量即为转换后的二值图像。
8.根据权利要求6所述的方法,其特征在于,还包括:
预处理单元,用于对所述原始文本图像进行图像增强;
所述笔画提取单元从图像增强后的原始文本图像中提取笔画图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810113659.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光照射装置
- 下一篇:使得计算机具有高可用性的方法和计算机系统