[发明专利]文档识别装置和方法有效
申请号: | 200810174109.1 | 申请日: | 2008-11-07 |
公开(公告)号: | CN101430758A | 公开(公告)日: | 2009-05-13 |
发明(设计)人: | 武部浩明;小泽宪秋;皆川明洋;藤井勇作;堀田悦伸;田中宏;藤本克仁;平井淳一;高桥清治 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/03;G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李 辉;吕俊刚 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 识别 装置 方法 | ||
技术领域
本发明涉及包括逻辑结构模型存储部的记录介质,该逻辑结构模型 存储部存储逻辑结构,该逻辑结构指示各种文档中的逻辑元素以及这些 逻辑元素之间的关系,并且该记录介质其中记录有文档识别程序,该文 档识别程序用于根据存储在该逻辑结构模型存储部中的逻辑结构来识别 所输入及所识别文档的逻辑结构;本发明还涉及包括该逻辑结构模型存 储部的文档识别装置以及用于该文档识别装置的文档识别方法。
背景技术
传统上存在一种文档数据输入系统,该系统为各种形式的文档准备 对要被提取的数据位置信息进行描述的布局定义,并且在识别该文档的 形式之后,使用该布局定义通过OCR来识别加有标签的数据(tagged data)。具体地说,在文档上写入代表矩形区域的标签名称的多组两个坐 标。例如,对应于数据“Fujitsu Taro”的标签是教育机构(诸如学校)的 “负责人姓名”。
该文档数据输入系统对所输入的文档图像以及通过使用该布局定义 来识别该文档图像而获得的识别结果进行并列地显示。用户对该文档图 像与该识别结果进行比较,并且判断该识别结果是否正确。当该识别结 果有误时,用户删除该识别结果,并且使用键盘等来输入正确的值。
然而,使用这种方法,因为用户要对该文档图像与识别结果进行比 较并且判断该识别结果是否正确,所以就阅读方面而言用户的负担重。 而且,不能避免人为的错误。因此,已经公开了在这种数据输入系统中 用于在所读取文档中存在错误时减轻数据校正工作的负担的各种技术。
例如,可以设想自动地产生与在文档识别处理中出现的错误的位置 相对应的文档布局图像的数据输入系统。具体地说,该数据输入系统根 据用于指定要被读取的文档的布局的布局信息,来分析所读取文档的文 档图像的布局,并且执行由该布局分析所确定的各个读取对象的字符识 别。该数据输入系统根据该布局信息以及该字符识别的结果数据来检测 布局分析错误,并且将与该错误出现位置相对应的文档图像显示在屏幕 上。
然而,上述技术存在的问题在于,它并不能始终减轻数据校正工作 的负担,相反,这种负担可能增加。
具体地说,因为仅显示与错误出现位置相对应的文档图像,所以当 放大并显示该文档图像时,可能不清楚该文档中这个文档错误所出现的 位置(即,在哪个字符串)。具体地说,当在该文档中存在相同字符串的 标题时,必须区分这些字符串。结果,用户必须缩小已被放大的图像并 显示,以检查在该图像周围的图像。这反而增加了用户负担。
使用上述技术,仅将读取文档时的错误呈现给用户。不能向用户显 示是否正确地校正了所显示的错误。换句话说,即使用户基于与错误出 现位置相对应的图像文档而手动地校正了该错误出现位置,这种校正的 内容并不是始终正确的。用户他自己/她自己需要通过可视的方式来检查 该校正内容。因此,难以确定这可以减轻数据校正工作的负担。
发明内容
根据本发明的一个方面,一种装置包括逻辑结构模型存储部,该逻 辑结构存储部存储指示各种文档中的逻辑元素以及这些逻辑元素之间的 关系的逻辑结构,该文档识别装置根据存储在该逻辑结构模型存储部中 的逻辑结构来识别所输入及所识别的文档的逻辑结构。该文档识别装置 包括:诸如文档数据存储机构的存储器,其将该文档上的字符串以及该 文档上的这些字符与存储在该逻辑结构模型存储部中的逻辑元素的彼此 关系之间的关联,作为文档数据而进行存储;文档数据存储过程机构或 模块,其针对通过识别所输入文档而获得的文档图像,来提取与存储在 该逻辑结构模型存储部中的这些逻辑元素相符的字符串,将这些字符串 存储在该文档数据存储机构中,提取满足存储在该逻辑结构模型存储部 中的这些逻辑元素之间关系的该文档上字符串的组合,并且将该文档上 的字符串与存储在该逻辑结构模型存储部中的这些逻辑元素之间关系的 关联,存储在该文档数据存储机构中;以及显示控制机构,当用户选择 了显示在显示单元上的该文档数据的字符串时,向该显示单元输出所识 别的文档图像以及存储在该文档数据存储机构中的该文档数据,从该文 档数据存储机构中指定与所选择的字符串相关的字符串,在该显示单元 上显示其中所指定字符串与其它字符串相区别的文档数据,并且在该显 示单元上显示至少包括该文档图像的文档数据的所指定字符串的最小区 域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810174109.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:入出室管理系统
- 下一篇:利用单词相关度的本体自动生成