[发明专利]信息处理设备及信息处理方法在审
申请号: | 201310286774.0 | 申请日: | 2013-07-09 |
公开(公告)号: | CN103714101A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 冈田茂;袖浦稔;花冈新治;上條裕义;天谷征;大谷和宏 | 申请(专利权)人: | 富士施乐株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/20 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 陈源;李铭 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 设备 方法 | ||
技术领域
本发明涉及信息处理设备和信息处理方法。
背景技术
通常,通过使用图像读取装置进行读取诸如技术文档之类的具有目录的文档,并将其转换为电子文档,然后在计算机终端或移动电子终端上查看该电子文档。在该情况下,根据文档中的页数,打开期望页可能是耗时并令人沮丧的。存在一种手动地对经常查阅的页面添加电子书签并使用该电子书签来查阅页面的功能。
例如,在日本未审查专利申请公开No.2006-85234中,从读取的图像中提取出诸如章节标题之类的文本并将链接信息添加至所提取的文本中。这使得用户能够从目录中的章节标题查阅到正文中的期望页面。同样在日本未审查专利申请公开No.2002-24796中,读取的图像经过字符识别,以提取出目录中的标题,并使提取出的标题与正文中对应的标题关联,使得一旦指定了目录中的标题,就能查阅期望页面的图像。
在使用目录查阅期望页的配置中,为了查阅某个期望项目的页面并随后查阅另一项目的页面,用户在搜索并指定下一个要查阅的项目之前要返回到目录的页面,然后查阅下一项目的页面。
发明内容
因此,本发明的目的是提供一种信息处理设备和信息处理方法,与没有使用根据本发明的示例性实施例的配置相比,当查看电子文档时该信息处理设备和信息处理方法具有改善的操作性能。
根据本发明的第一方面,提供了一种信息处理设备,其包括:读取单元、识别单元、目录分析单元、正文分析单元、以及创建单元。读取单元读取目录页的图像和正文页的图像。识别单元进行字符识别以识别目录页的图像中的字符和正文页的图像中的字符。目录分析单元分析目录页的图像并根据字符识别的结果至少获得标题项。正文分析单元分析正文页的图像并根据字符识别的结果使包括标题项的图像与标题项相关联。创建单元创建电子书签信息,其中用于使标题项与正文页的图像关联的书签信息被添加至所读取的图像的电子信息中。
根据本发明的第二方面,读取单元将预定数量的图像作为目录页处理,将其后的图像作为正文页处理。
根据本发明的第三方面,读取单元具有检测彩色纸的功能,并将彩色纸之前的图像作为目录页处理而将彩色纸之后的图像作为正文页处理。
根据本发明的第四方面,读取单元根据由识别单元进行的布局分析的结果和字符识别的结果来鉴别目录页和正文页。
根据本发明的第五方面,正文分析单元对正文页的图像进行布局分析以提取出小标题区域,并根据在该小标题区域上进行的字符识别的结果来使该小标题与标题项相关联。
根据本发明的第六方面,目录分析单元获得标题项以及对应于该标题项的页码,正文分析单元根据在包括页码的正文页的图像的区域上进行字符识别的结果以及对应于所述标题项的页码来使标题项与正文页的图像关联。
根据本发明的第七方面,提供了一种信息处理方法,其包括:读取目录页的图像和正文页的图像;进行字符识别,以识别目录页的图像中的字符和正文页的图像中的字符;分析目录页的图像并根据字符识别的结果至少获得标题项;分析正文页的图像并根据字符识别的结果使包括所述标题项的图像与所述标题项关联;以及创建电子书签信息,其中用于使所述标题项与所述正文页的图像关联的书签信息被添加至所读取的图像的电子信息中。
根据本发明的第一和第七方面,使用读取装置进行读取包括目录页的文档以创建电子文档。有利的是,与不使用本配置相比,可以改善查看电子文档的操作性能。
根据本发明的第二和第三方面,与不使用本配置相比,可以容易地鉴别目录页和正文页。
根据本发明的第四方面,可以利用比不使用本配置更少的时间和精力将包括目录页的文档转换为电子文件。
根据本发明的第五方面,可以使标题项与正文页中对应的图像关联,而不考虑正文页的布局结构。
根据本发明的第六方面,可以通过比不使用本配置更简单的处理来使标题项与正文中对应的图像关联。
附图说明
将根据以下附图详细地描述本发明的示例性实施例,其中:
图1是示出了本发明的示例性实施例的框图。
图2是示出了根据本发明的示例性实施例的操作的示例的流程图。
图3A和图3B示出了用于在读取文档时进行设置的屏幕的示例。
图4A和图4B示出了图3A和图3B所示的用于在读取文档时进行设置的屏幕的示例的继续。
图5示出了在分开读取目录页和正文页的情况下文档的处理。
图6A和图6B示出了根据目录跨越的指定页数进行读取的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310286774.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:蓄电装置用电极材料、蓄电装置以及电气设备
- 下一篇:全频带GNSS接收器