[发明专利]用于文档图像的畸变校正方法和设备有效
申请号: | 201410286333.5 | 申请日: | 2014-06-24 |
公开(公告)号: | CN105225218B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 魏晓明 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06K9/00;G06K9/20 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 康建忠 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文档 图像 畸变 校正 方法 设备 | ||
本发明涉及用于文档图像的畸变校正方法和设备。一种用于文档图像的畸变校正方法包括基线提取步骤,用于提取文档图像中包含的文本区域中的文本行的基线,其中各文本行对应于一条基线;基线延伸步骤,用于基于所提取的基线中包含的长基线延伸所提取的基线中包含的短基线;以及校正步骤,用于基于所提取的长基线和经延伸的短基线来校正文档图像的畸变。
技术领域
本发明涉及用于校正文档图像的畸变的方法和设备。更具体而 言,本发明涉及用于至少通过延伸文档图像中包含的短文本行来校正 文档图像的畸变的方法和设备。
背景技术
近年来,信息技术已经在诸如计算机视觉、图像处理和理解等的 多个领域快速发展,并且尤其电子文档处理领域获得日益广泛的关注 并且得到广泛应用。
在电子文档处理中,文档图像识别(诸如OCR)已经被应用于 并且有助于多种应用以及多种设备,该多种设备从具有图像拾取装置 (诸如扫描仪等)的用于文档处理的专业办公设备到具有用于拾取文 档图像的装置(诸如照相机等)的、可拾取并处理文档图像以清楚识 别这样的文档的内容的个人设备(诸如PC计算机、PDA、手持设备)。
随着配备有照相机的手持设备的发展,在各种环境(诸如文档的 办公室外数字化、外语路标的识别、以及视力障碍人员的文本语音输 入)中迫切需要移动(基于照相机的)OCR应用。
然而,由于扫描仪和照相机之间的差别,移动OCR成为新的挑 战。在基于扫描仪的文档捕获中,文档通常被压板按压,因此基本是 平的,并且由于文档的物理状态导致的畸变几乎没有。而在基于照相 机的文档捕获中,要被捕获的文档通常是不受约束的并且可能是不平 的,因此物理扭曲文档所导致的畸变是常见的现象。畸变将大大降低 OCR准确度,这是因为不平的文档形状使得针对被捕获图像的典型文 本处理(诸如,分割(文本行分割和字符分割)和识别)即使在局部 旋转之后仍变得困难。因此,用于照相机捕获的文档图像的畸变校正 是必要的用于移动OCR的处理。
现有技术中存在关于文档图像的畸变校正的多种研究。
一种研究是基于3D的技术。在典型的实现中,这种技术通过近 似原始文档表面来得到原始文档的3D表面形状,然后对这样得到的 3D表面进行校正(诸如基于一些专用模型进行平坦化)。原始文档表 面可通过诸如将照片投影到3D网格上的物理建模被近似,或者可使 用SFS(由明暗恢复形状)技术从单个图像中的明暗分布得出。
但是,这样的方法具有限制。特别地,对于物理建模,一些专用 的且复杂的附加设备是必需的,这样可能不方便并且在一些情况下费 时。对于由明暗恢复形状方法,应满足一些假设(诸如,近点光源) 并且应知晓一些现有照相机限制(例如,焦距),这只能通过准确的 照相机校准处理来获得。因此,这样的基于3D的方法通常需要更复 杂的设备机构以及费时的操作。
鉴于上述的基于3D的方法的缺陷,提出了针对文档的2D图像 的一些其它方法以确定和校正文档图像的畸变。一种这样的用于校正 文档图像的畸变的技术是基于如下假设:扭曲类型是特定类型并且预 先知晓。在典型实现中,这种技术假定弯曲文档的表面为某一几何类 型(诸如圆柱类型),因此基于文档表面具有某一几何类型的假定, 对于这种假定的文档图像的几何类型表面执行校正(诸如低秩矩阵恢 复和稀疏误差校正)。
但是,考虑到要被拾取图像的文档的实际表面通常具有比假定的 表面的简单形状更复杂的形状,这种技术不能有效地校正文档图像。
另一种方法是基于边界的方法,其基于文档图像的边界对文档图 像执行校正。参考文献[1]公开了一种基于边界的方法,该方法提取并 且使用文档边界以描述畸变。这对于在成像时遭遇的常见畸变(例如, 粘结扭曲)是适当的,这是因为该方法假设文档表面由两条相对边界 曲线构成(例如,打开的厚书本)。但是,此方法不能校正边界不是 相对的时的情况。另一限制是此基于边界的方法假定文档的四条边界 是完整的,然而实际存在的不完整边界的情况将导致不能生成整个文 档的扭曲网格(warping mesh)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410286333.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种确定电子设备间位置关系的方法及一种电子设备
- 下一篇:代码定位方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序