[发明专利]图像处理装置有效
申请号: | 201210119225.X | 申请日: | 2012-04-20 |
公开(公告)号: | CN102760233A | 公开(公告)日: | 2012-10-31 |
发明(设计)人: | 九津见毅 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京尚诚知识产权代理有限公司 11322 | 代理人: | 龙淳 |
地址: | 日本,*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 装置 | ||
技术领域
本发明涉及在由文件读取装置读取的文件图像的处理中,对文件图像中的通过文字识别而得到的文字列的倾斜进行取得的图像处理装置。
背景技术
近年来,已知有通过光学文字识别(OCR:Optical Character Recognition)读取文件,在行间附加该读取的图像的文件中的原文的译文(以下称为“注释(ruby)”)的技术。作为该技术的典型的文献,有与本申请为同一申请人申请的日本特愿2009-255373号。
在这种向文件图像添加注释的系统中,例如图17所示,即使在略微倾斜地扫描原文件而使文字列L11倾斜的情况下,或者原文件中存在倾斜的文字列L11的情况下,为了出于注释的美观的观点而沿着该倾斜的文字列倾斜地生成注释,需要取得文件图像中的各文字列的正确的倾斜值。该注释生成以外的处理也需要正确的文字列的倾斜值。
作为求取倾斜值的方法,现有技术中,通过与文字列的各文字外接的矩形的坐标、例如各矩形的左下坐标或者各矩形的中心坐标等决定基准,以文字列单位求得回归的直线,将该直线的倾斜作为文字列的倾斜值。
另外,作为不使用回归计算的方法,有根据文字列的始端的文字和终端的文字的坐标求得这两个文字之间的倾斜,作为上述文字列的倾斜值的方法。
在上述的求取文件图像的文字列的倾斜值的方法中,例如存在如下问题。
例如当原文件的文字是英文字母时,如图18所示与文字外接的矩形B11的上端与下端的高度不对齐,根据文字配置的不同,如果仅使它们的坐标回归,则如图19所示,存在真正的倾斜K11与求得的倾斜K12不同的情况。而且,因为需要回归计算,所以计算量大。
另外,在不进行回归计算而仅根据文字列的始端的文字和终端的文字求取文字列的倾斜的方法中,根据始端与文字和终端的文字的不同,存在真正的倾斜与求得的倾斜更大地不同的情况。
发明内容
本发明提供一种图像处理装置,其在由文件读取装置读取的文件图像的处理中,更准确地求取文件图像中的通过文字识别而得到的文字列的倾斜。
本发明的目的在于提供一种图像处理装置,其特征在于,包括:类似文字提取部,其提取并输出包括构成文字列的文字之中的形状和大小相互相同或类似的文字的文字组,其中,上述文字列包括从由文件读取装置读取的文件图像通过光学文字识别后而得到的文字;和倾斜计算部,其根据从该类似文字提取部输出的文字组的各文字的位置信息,计算上述文字列的倾斜值。
本发明的另一目的在于提供一种图像处理装置,其特征在于:上述类似文字提取部,提取包括在构成上述文字列的文字之中的最多的文字的文字组。
本发明的另一目的在于提供一种图像处理装置,其特征在于:上述类似文字提取部,提取包括在上述文字列中的语言中一般而言出现频率高的文字的文字组。
本发明的另一目的在于提供一种图像处理装置,其特征在于:上述类似文字提取部,从包括在构成上述文字列的文字之中的最多的文字的文字组和包括在上述文字列中的语言中一般而言出现频率高的文字的文字组之中,提取在上述文字列内文字间隔更均等的文字组。
本发明的另一目的在于提供一种图像处理装置,其特征在于:上述类似文字提取部,输出包括从所提取的上述文字组中摘录的文字的文字组。
附图说明
图1是本发明的图像处理装置的一例的框图。
图2是说明类似文字提取部为了计算倾斜而提取的文字组的一例的图。
图3是说明文字列的语言中一般而言出现频率高且文字的外接矩形对齐的文字的列表的例子的图。
图4是说明类似文字提取部为了计算倾斜而提取的文字组的其他例的图。
图5是说明类似文字提取部为了计算倾斜而输出的文字组的其他例的图。
图6是说明能够利用图7说明的方法解决的问题的图。
图7是说明倾斜计算部的文字列的倾斜值的计算方法的一例的图。
图8是说明倾斜计算部的文字列的倾斜值的计算方法的其他例的图。
图9是表示图2、图4、图5所示的情况的各文字的坐标变换后的坐标值的例子的表。
图10是表示图7所示的情况的各文字的坐标变换后的坐标值的例子的表。
图11是表示图8所示的情况的各文字的坐标变换后的坐标值的例子的表。
图12是说明图1的图像处理装置的处理例子的流程图。
图13A和图13B是说明图12的步骤S4的文字组选择提取处理的一例的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210119225.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序