[发明专利]一种处理表格图片中框选文字的方法及装置在审
申请号: | 201811317237.7 | 申请日: | 2018-11-03 |
公开(公告)号: | CN109447015A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 李鹏辉;竺晨曦;邱锡鹏 | 申请(专利权)人: | 上海犀语科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200082 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 位置坐标 文字内容 图片 还原 干扰识别 训练模型 框选 去除 预处理模块 还原模块 中文字 准确率 联合 | ||
本发明提供一种处理表格图片中框选文字的方法,包括:去除表格图片中的干扰识别项;利用联合训练模型,在表格图片中圈选出字条,获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容;利用表格特性对字条、字条位置坐标与文字内容进行表格还原。实施上述方法的装置,包括:用于去除表格图片中干扰识别项的预处理模块;利用联合训练模型,在表格图片中圈选出字条,获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容的识别模块;利用表格特性对字条、字条位置坐标与文字内容进行表格还原的表格还原模块。本发明可以提升表格图片中文字识别和还原准确率。
技术领域
本发明涉及一种表格处理方法,尤其是一种处理表格图片中框选文字的方法及装置。
背景技术
在OCR识别领域中,对于类似A4纸的大段文字识别的准确率较高。但针对于表格的识别,目前业界准确率都不是很高。因为原有的切字识别的方式会造成难以进行版面还原,且无法利用表格中的信息。
发明内容
针对上述问题中存在的不足之处,本发明提供一种可以提升表格图片中文字识别和还原准确率的一种处理表格图片中框选文字的方法及装置。
为实现上述目的,本发明提供一种处理表格图片中框选文字的方法,包括以下步骤:
步骤1、以去除表格图片中的干扰识别项;
步骤2、利用联合训练模型,在表格图片中圈选出字条,获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容;
步骤3、利用表格特性对字条、字条位置坐标与文字内容进行表格还原。
上述的一种处理表格图片中框选文字的方法,其中,在步骤1中,对表格图片进行预处理,以去除表格图片中的干扰识别项,对表格图片进行的预处理包括图片角度纠偏操作、或水印印章去除操作。
上述的一种处理表格图片中框选文字的方法,其中,在步骤2中,包括以下子步骤:
步骤21、对去除干扰识别项的表格图片进行RGB三通道处理,以形成至少两个表格图片层;
步骤22、通过卷积变换对每个表格图片层进行特征提取;
步骤23、在第一表格图片层中,预测出字条在第一表格图片层中的字条位置坐标;
步骤24、在第二表格图片层中,通过图像信息和应用语言模型得到与字条相对应的文字内容。
上述的一种处理表格图片中框选文字的方法,其中,在步骤23中,字条位置坐标包括左上坐标(x0,y0)、右上坐标(x1,y1)、右下坐标(x2,y2)、左下坐标(x3,y3)。
上述的一种处理表格图片中框选文字的方法,其中,在步骤3中,根据字条位置坐标进行表格行与表格列的切分,将文字内容导入字条位置中,根据语义判断进行单元格的结合,以完成整体表格的还原。
上述的一种处理表格图片中框选文字的方法,其中,还包括步骤4、呈现还原后的表格。
本发明还提供一种处理表格图片中框选文字的装置,包括:预处理模块、识别模块与表格还原模块;
预处理模块,用于去除表格图片中的干扰识别项;
识别模块,利用联合训练模型,在表格图片中圈选出字条,获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容;
表格还原模块,利用表格特性对字条、字条位置坐标与文字内容进行表格还原。
上述的装置,其中,所述预处理模块对表格图片进行的预处理包括图片角度纠偏操作、或水印印章去除操作。
上述的装置,其中,所述识别模块的实施步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海犀语科技有限公司,未经上海犀语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811317237.7/2.html,转载请声明来源钻瓜专利网。