[发明专利]文档图像处理装置以及文档图像处理方法无效
申请号: | 200710000960.8 | 申请日: | 2007-01-15 |
公开(公告)号: | CN101226595A | 公开(公告)日: | 2008-07-23 |
发明(设计)人: | 吴波;窦建军;乐宁;吴亚栋;贾靖 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 雒运朴;徐谦 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 处理 装置 以及 方法 | ||
技术领域
本发明涉及将文档作为图像进行输入并存储的文档图像处理装置以及文档图像处理方法,特别是涉及具有对于所输入的文档图像自动生成文档名并进行管理的功能的文档图像处理装置以及文档图像处理方法。
背景技术
一种利用图像扫描仪等图像输入装置将文档转换成图像,并以电子形式存储,且在之后可以检索的文档归档装置已经步入实用化。
另外,对于所存储的文档图像,为了便于管理而赋予了文档名。作为对图像数据自动地赋予文档名的现有技术,例如有中国专利公开公报CN1746884A、中国专利公开公报CN1658192A。
在中国专利公开公报CN1746884A中,记载有通过作为所拍摄的时间数据的日期时间、和表示在该日期时间拍摄的第几个图像数据的编号来生成文档名的技术。
另外,在中国专利公开公报CN1658192A中,记载有如下技术:采用由所给的经度及纬度等构成的拍摄地点的位置信息,对所拍摄的时间数据,用户通过手动输入赋予“×××宅”这样的拍摄地点等具体信息,而设为文档名。
然而,这样的现有技术,由于其目的在于对各文档图像生成不同文档名,所以在文档名中不能反映出文档图像的内容。因此,用户不能从文档名中掌握到该文档图像的内容,而为了确认内容,需要一个一个地打开文档图像的文件。
发明内容
本发明的目的是,提供一种不用麻烦用户的手,且可以自动地生成反映了文档图像的内容的有意义的文档名并进行管理的文档图像处理装置和文档图像处理方法。
为了达到上述目的,本发明的文档图像处理装置是对所存储的文档图像赋予文档名并进行管理的文档图像处理装置,其特征在于,具有:字形特征字典,其以单个文字为单位储存有文字图像的图像特征;标题抽出部,其抽取出在所输入的文档图像中存在的标题区域;图像特征抽出部,其将在由上述标题抽出部抽取出的标题区域中所包含的文字列的文字图像按单个文字进行分割,并抽出各文字图像的图像特征;候补文字列生成部,其以由上述图像特征抽出部抽出的文字图像的图像特征为基础,参照上述字形特征字典,选择图像特征的匹配度高的文字图像作为候补文字,并制作成相应于上述文字列的候补文字列,而且采用词义解析法来调整构成该候补文字列的各候补文字,并设为有意义的候补文字列;文档名制作部,其对上述所输入的文档图像,制作包含上述候补文字列生成部中生成的有意义的候补文字列的第一文档名。
根据上述构成,标题抽出部对文档图像中的标题区域进行定位,并抽取出该区域中所包含的文字列,即标题。接下来,图像特征抽出部,将由所抽取出的标题的文字列构成的图像按单个文字进行分割,并抽出各文字图像的图像特征。
然后,候补文字列生成部,以由上述图像特征抽出部抽出的文字图像的图像特征为基础,参照字形特征字典,选择图像特征的匹配度高的文字图像作为候补文字,并制作成相应于上述文字列的候补文字列。候补文字列,由于具有与标题区域中所包含的文字列相似的特征,所以也有候补文字列本身与抽取出的标题区域的文字相同而具有意义的场合。
然而,由于为字形的特征的匹配,所以也有可能是形状相似的其它文字。在此,候补文字列生成部,采用词义解析法调整构成该候补文字列的各候补文字,并设为有意义的候补文字列。由此,对于由与所抽取出的标题区域中包含的标题相同的文字构成、且带有相同意义的候补文字列,进行高概率的调整。
文档名制作部对于所输入的文档图像,制作由候补文字列生成部生成的包含有意义的候补文字列的文档名(第一文档名:有意义的文档名),利用该文档名来管理文档图像。
从而,不用麻烦用户的手,就可以对所存储的文档图像自动地赋予有意义的文档名,而且用户可以利用反映了文档图像的内容的文档名来阅览所存储的文档图像,可以简单地实施所存储的文档图像的管理及搜索。
关于本发明的其他目的,特征以及优点,可以通过以下的说明得到充分的理解。另外,通过参照附图的以下说明,可以了解本发明的优点。
附图说明
图1是表示本发明的一个实施方式的图,是表示文档图像处理装置的功能的功能方框图。
图2是本实施方式的文档图像处理装置的构成图。
图3是表示制作字形样板数据库的处理的说明图。
图4是文字图像外围特征的说明图。
图5(a)和图5(b)是网格方向特征的说明图。
图6是表示制作字形特征字典的处理的说明图。
图7是表示制作索引信息数据库的处理的说明图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710000960.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:连续流动-固相微萃取装置
- 下一篇:一种地埋式泵站一体化智能控制装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序