[发明专利]一种图像表格文字切分方法在审

申请号：	201510834283.4	申请日：	2015-11-25
公开（公告）号：	CN105574486A	公开（公告）日：	2016-05-11
发明（设计）人：	陈炳章;何宏靖;刘世林;吴雨浓	申请（专利权）人：	成都数联铭品科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	610041 四川省成都市天***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种图像表格文字切分方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像识别领域，特别涉及一种图像表格文字切分方法。

背景技术

图像识别技术是目前智能识别技术领域中非常重要的发展方向，图像识别的发展经历了三个阶段：文字识别、数字图像处理与识别、物体识别；其中在众多的图像识别技术中，对图像文字的识别技术显得尤为重要，这是因为图像文字往往比单纯图像包含更加重要的可利用信息，而且图像文字识别技术所应用的领域也很重要。文字识别一般是识别文字、字母、数字和符号，从印刷文字识别到手写文字识别，应用非常广泛。图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前，在图像识别的发展中，主要有三种识别方法：统计模式识别、结构模式识别、模糊模式识别。

随着图像文字的深入发展，越来越多种类的图像文字资料，被纳入图像文字识别的范畴中，其中表格作为文字数据记录汇总最精简表达方式，或者数据统计、结果分析中最常用的表达格式，是各种数据分析工具中基础工具。表格在各行各业应用的广泛性不言而喻。不难看出对于表格式图像文字识别的重要性，比如对一个企业年度业绩报表，可能包含企业年度业绩中最重要的统计数据和分析结果，这些信息的重要性和概括性是其他任何材料所比拟不了的，目前的网络信息中充斥着各种表格资料，但是很多表格都是以图片的形式提供，比如各种扫描档案文件、PDF文件，自动识别这些图像表格资料，将图片类型的表格内容还原成数字资料是将这些资料进行快速处理和分析的基础。

但是，由于表格资料本身的表格结构特征，使得表格图像文字的识别比一般的普通图像文字资料更加困难。现有文字识别技术在对图像中文字识别时，首先需要将图像中的字符串切分开，形成包含单个文字的小图片，然后使用一定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法，即是将图像文字二值化处理后，通过垂直投影找到两个文字之间的分界线，根据分界线将文字切分开来。由于表格的框线的存在，直接使用传统的投影法所实现的文字切分和识别就不太现实。同时由于表格本身结构的复杂多变，复杂多变的轮廓框线使得投影法难以实现将表格文字信息的切分。面对大量的图像表格数据的快速分析需要，亟待一种快速，准确，完整的图像表格文字切分方法。

发明内容

本发明的目的在于克服现有技术中所存在的上述不足，提供一种图像表格文字切分方法，能够快速准确的将图像表格中的文字信息切分出来。本发明首先检测出待识别图像表格中的单元格，提取出单元格的轮廓点集，根据单元格的轮廓点集，构造出包含单元格轮廓点集的面积最小的矩形区域，提取出该矩形区域的四角顶点坐标，根据该四角顶点坐标将对应单元格中的文字信息切分提取出来，在单元格内容整体切分出来的基础上，通过侧向投影实现单元格中的行切分，再通过垂直投影实现每一行的单个文字切分。通过本发明方法实现的图像表格文字切分，单元格切分准确，切分效率高；克服了一直以来图像表格文字识别中切分困难的问题。

为了实现上述发明目的，本发明提供以下技术方案，

一种图像表格文字切分方法，包含以下实现过程：

将待处理图片进行二值化处理，检测出所述图像表格中的单元格，依次将各单元格中的内容作为一个整体切分出来，形成对应的子图片；

再使用投影法将子图片中的文字信息切分出来。

具体的，本图像表格文字切分方法采用以下实现步骤：

(1)将待处理图像表格进行二值化处理，使用openCV图像处理工具中的 findcontours函数检测出图像表格单元格轮廓；将检测出的单元格轮廓的点集提取出来放置在对应的点类中(如：用Vector1，Vector2，Vector3......来表示)； findcontours函数能够根据表格框线轮廓的特点将单元格的轮廓检测出来，并将检测出的单元格轮廓点集提取出来，检测效率高。

(2)对所述步骤(1)提取出的单元格轮廓点集，调用minAreaRect函数构建出包含单元格轮廓点集的面积最小的旋转矩形区域；并提取出该旋转矩形区域的四角顶点坐标点；

(3)根据四角顶点坐标值将对应单元格中的文字信息作为整体切分出来，形成对应的子图片；

(4)采用投影法将所述子图片中的文字信息依次切分出来。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司，未经成都数联铭品科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510834283.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种图像表格文字切分方法在审

专利文献下载