[发明专利]行方向判定方法以及装置无效
申请号: | 200810145613.9 | 申请日: | 2006-03-30 |
公开(公告)号: | CN101350067A | 公开(公告)日: | 2009-01-21 |
发明(设计)人: | 胜山裕;小泽宪秋 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李辉 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方向 判定 方法 以及 装置 | ||
本申请是申请日为2006年3月30日,申请号为200610066977.9,发明名称为“行方向判定程序、方法以及装置”的发明专利申请的分案申请。
技术领域
本发明涉及OCR(Optical Character Recognition:光学字符识别)技术,更详细地说,涉及用于判定是纵写还是横写的技术。
背景技术
OCR技术是以由扫描仪等所读入的文件图像数据为对象,识别布局,对文本区域实施文字识别的技术。近年来,为了进行票单等的文件图像数据的保管、检索、再利用,使用了OCR技术的文件管理系统受到注目。在该文件管理系统中,在对文本区域实施文字识别时,首先根据文字配置求出行,然而有时由于文本区域内的文字配置而误判定行方向。
以往,判定行方向的技术有以下技术。
例如,在日本特开平08-263587号公报中揭示了使用语言信息的文字串方向推断技术。具体地说,生成在纵方向和横方向投影的图像的直方图,根据该直方图检测图像与图像的间隔窄的方向来判定为行方向。在所有的方向上文字间隔都大致相同的情况下,在2个方向上进行文字识别,使用单词词典把识别结果的文字串分解为词节。将此时的词节数按纵方向和横方向进行比较,输出词节数少的方向。例如,在包含銀行振込的图像中,在横方向,“銀行”和“振込”构成词节,词节数为2个。在纵方向,为“銀”、“振”、“行”和“込”4个,横方向被选择为行方向。
另外,在日本特开平08-63545号公报中揭示了以下技术。即,抽出被指定为处理对象的文字区域的外接行,针对各外接行生成文字方向。针对各外接行和各文字方向进行文字识别处理来生成文字点阵,针对各文字点阵进行语言处理,求出各文字点阵的构成单词率或者独立词含有率。根据针对各文字点阵所求出的构成单词率或者独立词含有率,决定指定区域的文字方向和行方向。
而且,在日本特开平07-220027号公报中揭示了以下技术。即,抽出被指定为处理对象的文字区域的外接行,针对各外接行生成文字方向。针对各外接行和各文字方向进行文字识别处理来生成文字点阵,针对各文字点阵进行语言处理,求出各文字点阵的构成单词数或者书写长度是1的独立词数。根据针对各文字点阵所求出的构成单词数或者书写长度是1的独立词数,决定指定区域的文字方向和行方向。
而且,在日本特开2000-20638号公报中揭示了能可靠判别纵写/横写的文字串方向判别方法。具体地说,进行:图像读取处理,把记载有文字串的文件分解为像素,作为图像数据来读取;第1文字串抽出处理,假定文件的文字串是纵写,从由图像读取处理所读取的图像数据中抽出纵方向的开头部的文字串;第1文字识别处理,从由第1文字串抽出处理所抽出的文字串中切出构成该文字串的多个文字进行识别;第1单词检索处理,参照单词词典,对使用由第1文字识别处理所识别的多个文字所拼写的单词进行检索;第2文字串抽出处理,假定文件的文字串是横写,从由图像读取处理所读取的图像数据中抽出横方向的开头部的文字串;第2文字识别处理,从由第2文字串抽出处理所抽出的文字串中切出构成该文字串的多个文字进行识别;第2单词检索处理,参照单词词典,对使用由第2文字识别处理所识别的多个文字所拼写的单词进行检索;以及纵横判定处理,根据第1和第2单词检索处理的检索结果,判定记载在文件内的文字串的方向是纵写还是横写。
并且,在日本特开平08-194773号公报中揭示了以下技术。即,具有:第1横写/纵写判定步骤,从所输入的文件图像中针对各文字抽出外接矩形,针对该文件图像的行方向和列方向各方算出各外接矩形之间的重复度,对行方向和列方向的重复度进行比较,判定文件图像是横写还是纵写;以及第2横写/纵写判定步骤,求出在文件图像的行方向和列方向上邻接的各个外接矩形的中心间距,以行方向和列方向的中心间距的平均值为基础,判定文件图像是横写还是纵写,其中,根据处理对象文字数,选择第1和第2判定步骤来进行是横写还是纵写的判定。之后,进行外接矩形的坐标转换,并检测文件图像的倾斜,在进行了倾斜校正后,进行文字切出和文字识别。
而且,在日本特开昭62-54380号公报中揭示了以下技术。即,在纵方向和横方向上扫描输入图像内的伪正方形的区域,针对形成文字部的像素求出直方图,通过对根据该直方图所求出的文字间隔长度的平均值进行比较,使用简易方法抽出输入图像的行方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810145613.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:制糖业乳化石灰浆离心泵
- 下一篇:一种电热水袋