[发明专利]文本图像的校正方法和装置有效
申请号: | 201410781378.X | 申请日: | 2014-12-16 |
公开(公告)号: | CN104504387B | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 张伟;周炳;陈茂林 | 申请(专利权)人: | 杭州华为数字技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨贝贝;黄健 |
地址: | 310053 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 校正 方法 装置 | ||
本发明实施例提供一种文本图像的校正方法和装置,通过本发明实施例提供的文本图像的校正方法和装置在进行文本图像的校正过程中,考虑到文本图像中各个区块对应的梯度直方图可以准确的反映各个区块中横竖笔画的分布情况,因此根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向较为准确,从而可以获取准确率较高的校正图像。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种文本图像的校正方法和装置。
背景技术
常见的,人们在需要记录文档中的信息时,通常使用手机的摄像头、数码相机等对文档进行拍摄,可快速便捷的记录了文档中的信息,但通常由于文档的倾斜、积厚、摄像头的摄像面的倾斜等原因,导致获取的文本图像中各个字符发生了形变,不便于人们查看;为了解决文档中的文本在文本图像中形变,通常采用以下四个步骤进行校正:1、文本行基线跟踪,2、竖直方向估计,3、建立三维网格,实现三维重建,4、根据三维重建的结果完成校正。在文本行基线跟踪步骤中,首先随机选取种子点,然后从以种子点为中心的区块开始,在间隔点的上下左右不同位置和方向上寻找特征相似的区域,实现向种子点的左边和右边探测文本行基线的目的;在竖直方向估计步骤中,假设图像中竖直方向的笔画数最多,设计最优化算法找到包含竖直笔画的区域集合,通过该集合来估计垂直方向,在建立三维网格的步骤中,假设二维坐标在三维空间下满足平行四边形约束,计算像素点的三维坐标,实现三维重建。最后在根据三维重建的结果完成校正的步骤中,是利用三维网格坐标和文档图像坐标的对应关系实现几何校正。
但采用上述方法校正文本图像的过程中发现,文本行跟踪步骤中,是基于像素点所在区块的特征相似度形成文本行,而基于像素点的操作的复杂度非常高,影响了校正的实用性;另一方面,该方案是基于拉丁语系中竖直笔画占多数的情况所设计的,但对中日韩文字来说,存在水平笔画占多数的情况,当遇到水平笔画占多数的情况时,竖直笔画方向估计步骤便会产生了较大的误差,大大降低了校正准确率。
发明内容
本发明实施例提供一种文本图像的校正方法和装置,用于优化文本图像的校正过程,提升校正准确率。
第一方面,本发明实施例提供一种文本图像的校正方法,包括:
确定文本图像中各个文本行的文本行基线,并获取文本图像中各个区块对应的梯度直方图;所述文本行基线是根据所述文本图像中各个像素点在所述文本图像中的第一坐标和灰度确定的;所述梯度直方图是根据所述区块内各个像素点的梯度向量确定的;所述区块是通过对所述文本图像进行分区获得的,所述文本图像中各个区块包括的像素点的总和为所述文本图像的全部像素点;所述文本图像中任意两个区块之间无相同的像素点;
根据每一个区块内的第一基线的延伸方向和每一个区块对应的梯度直方图,确定各个文本行基线上每一个像素点的竖直笔画方向;所述第一基线为所述文本行基线位于所述第一基线所属的区块内的部分;
根据每一个文本行基线和每一个文本行基线上每一个像素点的竖直笔画方向,在所述文本图像中确定各个用于建立二维网格的各个像素点,并根据各个所述用于建立二维网格的各个像素点建立二维网格;所述各个用于建立二维网格的各个像素点分别为所述二维网格中各个四边形的各个顶点;
根据所述二维网格中每一个四边形的各个顶点的第一坐标和三维空间下平行四边形约束条件,确定三维网格;所述三维网格中每一个四边形与所述二维网格中每一个四边形一一对应;所述三维网格中的四边形的各个顶点与该三维网格中的四边形对应的二维网格中的四边形的各个顶点一一对应;
根据所述三维网格中每一个四边形的每一个顶点的三维坐标,和所述二维网格中每一个四边形的每一个顶点的第一坐标,确定待建立的校正文本图像的各个校正像素点与所述文本图像中各个像素点的对应关系;
根据所述对应关系,建立校正文本图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州华为数字技术有限公司,未经杭州华为数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410781378.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序