[发明专利]一种图片文字切割系统在审
申请号: | 202110018432.5 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112699890A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 杨黎明 | 申请(专利权)人: | 北京美斯齐文化科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/36 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 涂琪顺 |
地址: | 100193 北京市海淀区天秀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 文字 切割 系统 | ||
本发明公开了一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:前处理模块用于定位图像中的非文字部分(即图片),将其剔除;预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;本发明的有益效果是:通过一系列的图像处理可以将图像中的文字按照位置格式分块,再将每一块分割成单列(行)文字,最后逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置;通过降噪模块减少图片分析中的干扰因素,提高图片文字识别的效率;通过提取模块提高文字识别的准确率和效率。
技术领域
本发明属于图像处理技术领域,具体涉及一种图片文字切割系统。
背景技术
在传统文化思维中,图像与文字渊源深厚,从我国最早的象形文字便可窥见一斑。Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发;OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上,轻量级而且高效-由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法;NumPy(Numerical Python)是Python的一种开源的数值计算扩展,可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
开发语言采用Python,利用opencv2视觉处理算法,NumPy的数值计算扩展,主要技术包含图像形态学变换(腐蚀、膨胀、开运算和闭运算),canny边缘检测,霍夫变换,垂直投影法,轮廓检索,轮廓拟合,二值化;对于印刷体文献资源可以高识别率实现切割,对于损害或者腐蚀比较严重的文献资源,会产生切割误差。
为了最终得到图片中的每一个字和字所在的位置,为此我们提出一种图片文字切割系统。
发明内容
本发明的目的在于提供一种图片文字切割系统,最终得到图片中的每一个字和字所在的位置。
为实现上述目的,本发明提供如下技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:
前处理模块用于定位图像中的非文字部分(即图片),将其剔除;
预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;
分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;
分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;
分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;
接口封装模块用于将程序封装成API接口。
作为本发明的一种优选的技术方案,图片文字分割方法如下:
步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;
步骤二:再将每一块分割成单列(行)文字;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京美斯齐文化科技有限公司,未经北京美斯齐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110018432.5/2.html,转载请声明来源钻瓜专利网。