[发明专利]一种图像表格文字切分方法在审
申请号: | 201510834283.4 | 申请日: | 2015-11-25 |
公开(公告)号: | CN105574486A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 陈炳章;何宏靖;刘世林;吴雨浓 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 表格 文字 切分 方法 | ||
技术领域
本发明涉及图像识别领域,特别涉及一种图像表格文字切分方法。
背景技术
图像识别技术是目前智能识别技术领域中非常重要的发展方向,图像识别 的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别;其中在 众多的图像识别技术中,对图像文字的识别技术显得尤为重要,这是因为图像 文字往往比单纯图像包含更加重要的可利用信息,而且图像文字识别技术所应 用的领域也很重要。文字识别一般是识别文字、字母、数字和符号,从印刷文 字识别到手写文字识别,应用非常广泛。图像识别问题的数学本质属于模式空 间到类别空间的映射问题。目前,在图像识别的发展中,主要有三种识别方法: 统计模式识别、结构模式识别、模糊模式识别。
随着图像文字的深入发展,越来越多种类的图像文字资料,被纳入图像文 字识别的范畴中,其中表格作为文字数据记录汇总最精简表达方式,或者数据 统计、结果分析中最常用的表达格式,是各种数据分析工具中基础工具。表格 在各行各业应用的广泛性不言而喻。不难看出对于表格式图像文字识别的重要 性,比如对一个企业年度业绩报表,可能包含企业年度业绩中最重要的统计数 据和分析结果,这些信息的重要性和概括性是其他任何材料所比拟不了的,目 前的网络信息中充斥着各种表格资料,但是很多表格都是以图片的形式提供, 比如各种扫描档案文件、PDF文件,自动识别这些图像表格资料,将图片类型 的表格内容还原成数字资料是将这些资料进行快速处理和分析的基础。
但是,由于表格资料本身的表格结构特征,使得表格图像文字的识别比一 般的普通图像文字资料更加困难。现有文字识别技术在对图像中文字识别时, 首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后使用一 定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法, 即是将图像文字二值化处理后,通过垂直投影找到两个文字之间的分界线,根 据分界线将文字切分开来。由于表格的框线的存在,直接使用传统的投影法所 实现的文字切分和识别就不太现实。同时由于表格本身结构的复杂多变,复杂 多变的轮廓框线使得投影法难以实现将表格文字信息的切分。面对大量的图像 表格数据的快速分析需要,亟待一种快速,准确,完整的图像表格文字切分方 法。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种图像表格 文字切分方法,能够快速准确的将图像表格中的文字信息切分出来。本发明首 先检测出待识别图像表格中的单元格,提取出单元格的轮廓点集,根据单元格 的轮廓点集,构造出包含单元格轮廓点集的面积最小的矩形区域,提取出该矩 形区域的四角顶点坐标,根据该四角顶点坐标将对应单元格中的文字信息切分 提取出来,在单元格内容整体切分出来的基础上,通过侧向投影实现单元格中 的行切分,再通过垂直投影实现每一行的单个文字切分。通过本发明方法实现 的图像表格文字切分,单元格切分准确,切分效率高;克服了一直以来图像表 格文字识别中切分困难的问题。
为了实现上述发明目的,本发明提供以下技术方案,
一种图像表格文字切分方法,包含以下实现过程:
将待处理图片进行二值化处理,检测出所述图像表格中的单元格,依次将 各单元格中的内容作为一个整体切分出来,形成对应的子图片;
再使用投影法将子图片中的文字信息切分出来。
具体的,本图像表格文字切分方法采用以下实现步骤:
(1)将待处理图像表格进行二值化处理,使用openCV图像处理工具中的 findcontours函数检测出图像表格单元格轮廓;将检测出的单元格轮廓的点集提 取出来放置在对应的点类中(如:用Vector1,Vector2,Vector3......来表示); findcontours函数能够根据表格框线轮廓的特点将单元格的轮廓检测出来,并将 检测出的单元格轮廓点集提取出来,检测效率高。
(2)对所述步骤(1)提取出的单元格轮廓点集,调用minAreaRect函数构 建出包含单元格轮廓点集的面积最小的旋转矩形区域;并提取出该旋转矩形区 域的四角顶点坐标点;
(3)根据四角顶点坐标值将对应单元格中的文字信息作为整体切分出来, 形成对应的子图片;
(4)采用投影法将所述子图片中的文字信息依次切分出来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510834283.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸活体检测的方法和装置
- 下一篇:视频火焰检测方法、装置及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序