[发明专利]文档图像生成装置和文档图像生成方法有效
申请号: | 201010538990.6 | 申请日: | 2010-11-05 |
公开(公告)号: | CN102053950A | 公开(公告)日: | 2011-05-11 |
发明(设计)人: | 佐田以知子;九津见毅 | 申请(专利权)人: | 夏普株式会社 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/27;G06F17/28;G06K9/20 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;陈炜 |
地址: | 日本大阪*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 生成 装置 方法 | ||
1.一种文档图像生成装置,由表现包含多个行的文档的图像,生成表现对文档附加了对文档包含的单词或由多个单词构成的词组的补充说明的带补充说明的文档的图像,所述文档图像生成装置包括:
原文档图像取得部,取得表现文档的原文档图像;
字符识别部,进行该原文档图像取得部所取得的原文档图像包含的字符的识别和原文档图像中的字符位置的特别指定;
补充说明取得部,通过对由该字符识别部所识别的字符构成的文档进行自然语言处理,确定文档包含的单词或词组的含义,取得与各单词或词组的含义对应的补充说明;
位置决定部,根据所述字符识别部所识别的字符的位置,对于与各单词或词组对应地取得的补充说明,将在原文档图像中与该单词或词组靠近的行间的位置确定为要在文档中配置补充说明的位置;和
图像生成部,通过将补充说明文本层与由原文档图像构成的原文档图像层重叠,生成表现带补充说明的文档的图像,所述补充说明文本层在与该位置决定部所确定的原文档图像中的位置相当的位置配置了各补充说明。
2.根据权利要求1所述的文档图像生成装置,其特征在于,
所述位置决定部包括:
词组判定部,判定取得了补充说明的词组是否是该词组包含的多个单词在文档中不连续配置的不连续词组;和
说明配置位置决定部,在取得了补充说明的词组是不连续词组的情况下,将与不连续词组包含的起始单词、不连续词组包含的连续单词列、或不连续词组包含的最长单词中的任意一个在原文档图像中靠近的行间的位置确定为要在文档中配置补充说明的位置。
3.根据权利要求2所述的文档图像生成装置,其特征在于:
所述图像生成部,还将标记图像层与原文档图像层重叠,所述标记图像层由在与原文档图像中的不连续词组的位置相当的位置配置了表示是不连续词组的标记的图像构成。
4.根据权利要求1至3中的任意一项所述的文档图像生成装置,其特征在于:
还包括说明附加对象选择部,选择在文档包含的单词或词组之中要在文档中配置补充说明的单词或词组,
其中,所述位置决定部还包括:
说明长度判定部,判定补充说明的长度是否比对应于该补充说明的单词或词组的长度长;
对象前后说明附加判定部,在补充说明的长度比对应于该补充说明的单词或词组的长度长的情况下,判定所述单词或词组的前后的单词是否是要配置其他补充说明的单词;
说明扩张位置决定部,在对应于补充说明的单词或词组的前后的单词的任意一者或两者不是要配置其他补充说明的单词的情况下,将包含与对应于补充说明的单词或词组靠近的行间的位置、和与所述单词或词组的前后的单词之中不是要配置其他补充说明的单词的单词靠近的行间的位置的位置确定为要在文档中配置补充说明的位置;
前后说明长度判定部,在对应于补充说明的单词或词组的前后的单词中的任意一者或两者是要配置其他补充说明的单词的情况下,判定其他补充说明的长度是否比对应于补充说明的单词或词组的前后的单词之中要配置其他补充说明的单词的长度减去规定长度所得的长度短;
说明部分扩张位置决定部,在其他补充说明的长度比要配置其他补充说明的单词的长度减去规定长度所得的长度短的情况下,将包含与对应于补充说明的单词或词组靠近的行间的位置、和与所述单词或词组的前后的单词之中要配置其他补充说明的单词并且是其他补充说明的长度比从该单词的长度减去规定长度所得的长度短的单词靠近的行间的位置的一部分的位置确定为要在文档中配置补充说明的位置;和
说明缩小率计算部,计算将比字符串的长度长的补充说明的长度缩小的缩小率,该字符串是能够在确定为要在文档中配置补充说明的位置的位置配置的字符串。
5.根据权利要求1至4的任意一项所述的文档图像生成装置,其特征在于:
所述图像生成部还将原文档文本层与原文档图像层重叠,所述原文档文本层将表示原文档图像包含的各字符的文本数据以透明的状态配置在与原文档图像中的各字符的位置相当的位置。
6.根据权利要求1至5的任意一项所述的文档图像生成装置,其特征在于:
所述补充说明取得部,作为补充说明取得单词或词组的译词、单词或词组的读法、或者对单词或词组的注释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010538990.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:治疗糖尿病的中药制剂及其制备方法
- 下一篇:用于重新加载应用图像的设备和方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序