[发明专利]图像处理设备及图像处理方法有效
申请号: | 201010122841.1 | 申请日: | 2010-02-26 |
公开(公告)号: | CN101820489A | 公开(公告)日: | 2010-09-01 |
发明(设计)人: | 三沢玲司;小坂亮;金津知俊;相马英智 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | H04N1/00 | 分类号: | H04N1/00 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军 |
地址: | 日本东京都*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 设备 方法 | ||
技术领域
本发明涉及一种能够生成能够从文档图像中搜索对象的电子文档数据 的图像处理设备、图像处理方法及计算机程序。
背景技术
传统上,期望构建一种能够在文档图像中搜索字符以外的对象(例如 图片(picture)、图形、线图(line drawing)和表格),使得能够容易地使 用这些对象的图像处理系统。除非特别指出,否则在下面的说明中描述的 对象是字符以外的对象。
例如,图像处理系统从文档图像中提取对象,并判断在该对象附近是 否存在注释(caption)字符串(即解释对象的字符串)。如果判断为存在注 释字符串,则图像处理系统将注释字符串指定为与该对象相关联的元数据 (metadata),从而能够基于元数据来搜索对象。
然后,对与元数据相关联的各个对象进行JPEG压缩,并将其存储为 单个电子文档。当应用程序使用上述电子文档时,应用程序能够使用元数 据作为关键词来进行搜索,以找到对象。
此外,在邻近对象的注释是图号(例如“图1”)的情况下,一般的文 档图像包括正文,在正文中描述代表相同图号的字符串以解释对象。更具 体来说,可以在正文中找到与在注释中描述的图号相同的表达。
如在日本特开平10-228473号公报中所讨论的,存在一种传统技术, 其能够通过在注释中的图号和正文中的图号之间自动生成链接,来形成超 文本。例如,在邻近对象的注释包括图号“图1”并且正文包括语句“图1 是AAA。”的情况下,可以在注释中的“图1”和正文中的“图1”之间生 成超链接。此外,在上述现有技术中讨论的技术可以通过在对象和相关正 文之间自动生成链接来形成超文本。
另一方面,多功能外围设备(MFP,multifunction peripheral)具有通 过对扫描的输入文档图像进行图像处理和格式转换处理来生成电子文档的 能力,并且具有经由网络将生成的电子文档发送到个人计算机(PC)的发 送功能。
图像处理包括通过对文档图像中包含的字符图像进行字符识别处理 来获取字符代码的处理。图像处理还包括将文档图像中的图形转换为矢量 数据的矢量化处理。在格式转换处理中,将经过上述图像处理的数据转换 为预定电子文档格式(例如便携式文档格式(PDF,portable document format)),以生成电子文档文件。
如在日本特开2009-009526号公报中讨论的,存在一种传统技术,其 用于将字符识别结果作为透明文本(即通过将透明颜色指定为描绘颜色而 以隐形的状态描绘的字符代码)嵌入到图像文件中,并将数据转换为电子 文档格式(例如PDF或XPS)。当显示以这种方式生成的电子文档文件时, 在文档图像的字符部分中描绘透明文本。
在这种情况下,如果用户进行关键词搜索,则系统搜索透明文本。然 而,用户不能在视觉上识别透明文本本身。因此,用户感觉好像搜索到了 文档图像中的目标字符图像部分。以这种方式,可以以强调的状态显示对 应于要搜索的关键词的字符图像部分。因此,用户能够有效地识别目标字 符图像部分。
另一方面,在将注释字符串作为元数据添加到字符以外的对象、使得 可以在电子文档中搜索该对象的情况下,希望强调在关键词搜索中命中的 搜索结果(即目标对象)。
然而,在这种情况下要搜索的目标对象是颜色和形状差别很大的图 片、图形和表格对象中的任何一个。因此,强调显示可能不带来期望的效 果。用户不能识别在搜索中命中的目标对象。
例如,在用红色强调搜索到的对象的轮廓的情况下,如果搜索到的对 象是在搜索到的对象附近或在整个区域的大部分中包括红色部分的图片对 象,则搜索结果的强调显示不是有效的。更具体来说,识别在搜索中命中 的对象,对于用户来说是非常困难的。
此外,在通过网络发送生成的电子文档数据的情况下,希望减小电子 文档数据的数据大小。然而,如果对从文档图像中提取的各对象(例如图 片)进行独立压缩,并将压缩后的图像数据与背景图像数据组合并作为单 个电子文件存储,则获得的文件的大小与通过压缩一个整体原始文档图像 获得的文件大小相比,趋于变大。
更具体来说,在发送包含图片的文档图像的情况下,通过压缩包括图 片部分和背景的整个图像来作为一个压缩图像数据,而不是作为独立的压 缩图像数据来存储提取的图片对象和背景,可以有效地减小发送的图像的 总数据大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010122841.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无杆熨烫机
- 下一篇:一种方便使用的挂烫机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序