[发明专利]一种图片文字切割系统在审

专利信息
申请号: 202110018432.5 申请日: 2021-01-07
公开(公告)号: CN112699890A 公开(公告)日: 2021-04-23
发明(设计)人: 杨黎明 申请(专利权)人: 北京美斯齐文化科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/36
代理公司: 北京化育知识产权代理有限公司 11833 代理人: 涂琪顺
地址: 100193 北京市海淀区天秀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图片 文字 切割 系统
【说明书】:

发明公开了一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:前处理模块用于定位图像中的非文字部分(即图片),将其剔除;预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;本发明的有益效果是:通过一系列的图像处理可以将图像中的文字按照位置格式分块,再将每一块分割成单列(行)文字,最后逐个分割出图片中的所有文字,最终得到图片中的每一个字和字所在的位置;通过降噪模块减少图片分析中的干扰因素,提高图片文字识别的效率;通过提取模块提高文字识别的准确率和效率。

技术领域

本发明属于图像处理技术领域,具体涉及一种图片文字切割系统。

背景技术

在传统文化思维中,图像与文字渊源深厚,从我国最早的象形文字便可窥见一斑。Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发;OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上,轻量级而且高效-由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法;NumPy(Numerical Python)是Python的一种开源的数值计算扩展,可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

开发语言采用Python,利用opencv2视觉处理算法,NumPy的数值计算扩展,主要技术包含图像形态学变换(腐蚀、膨胀、开运算和闭运算),canny边缘检测,霍夫变换,垂直投影法,轮廓检索,轮廓拟合,二值化;对于印刷体文献资源可以高识别率实现切割,对于损害或者腐蚀比较严重的文献资源,会产生切割误差。

为了最终得到图片中的每一个字和字所在的位置,为此我们提出一种图片文字切割系统。

发明内容

本发明的目的在于提供一种图片文字切割系统,最终得到图片中的每一个字和字所在的位置。

为实现上述目的,本发明提供如下技术方案:一种图片文字切割系统,包括前处理模块、预处理模块、分块模块、分列(行)模块、分字模块、接口封装模块,其中:

前处理模块用于定位图像中的非文字部分(即图片),将其剔除;

预处理模块用于图像灰度化,二值化,图像形态学变化,边缘检测;

分块模块用于形态学腐蚀提取图像中的框线,根据框线提取文字块的轮廓,通过轮廓提取每个文字块;

分列(行)模块用于形态学膨胀让列(行)之间的分隔更明显,再通过垂直投影法提取列(行)分割点,根据分割点信息分割出每一列(行)元素;

分字模块用于使用垂直投影法对每列(行)之中的元素定位,按照定位点分割出每个字,对于分割出的字横向和纵向分别统计垂直投影,定位字的有效部分,剔除多余的空白部分;对提取出的字进行尺寸匹配,符合匹配结果的字输出为单个字图像,并定位其所在位置,不符合尺寸匹配的再进入一次垂直投影,提取出符合尺寸匹配的字;

接口封装模块用于将程序封装成API接口。

作为本发明的一种优选的技术方案,图片文字分割方法如下:

步骤一:通过一系列的图像处理将图像中的文字按照位置格式分块;

步骤二:再将每一块分割成单列(行)文字;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京美斯齐文化科技有限公司,未经北京美斯齐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110018432.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top