[发明专利]用于分析并确定文档中信息的相关性的装置和方法有效
申请号: | 200810004819.X | 申请日: | 2008-02-02 |
公开(公告)号: | CN101236609A | 公开(公告)日: | 2008-08-06 |
发明(设计)人: | 武部浩明;藤本克仁 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/72 | 分类号: | G06K9/72 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 孙海龙 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 分析 确定 文档 信息 相关性 装置 方法 | ||
1、一种用于分析并确定指定表格中包含的信息的相关性的装置,在所述表格中包含多个模块,所述多个模块中的至少一个模块包含表示表头的数据,所述多个模块中的其余模块包含与表头信息关联的数据,所述用于分析并确定指定表格中包含的信息的相关性的装置包括:
存储器,该存储器用于存储多个模板,所述模板具有多个节点、分别与所述多个节点关联的字符数据、以及所述多个节点之间的相对位置信息;和
处理器,该处理器用于根据一处理来分析并确定所述信息的相关性,所述处理包括以下步骤:
获取所述指定表格中的所述多个模块中包含的数据,
确定所述多个模块的相对位置,以生成相对位置信息,
与所述模板的所述字符数据和所述多个节点的相对位置信息相比较地,分析从所述多个模块获取的所述数据和所述多个模块的所述相对位置信息,以及
确定所述多个模块中包含的所述数据的相关性。
2、根据权利要求1所述的装置,其中,所述关联是所述多个模板之间的层级关系。
3、根据权利要求2所述的装置,其中,所述节点与下位层级中的所述多个模板关联,
所述处理还包括以下步骤:检测所述下位层级中的所述模板。
4、一种分析并确定指定表格中包含的信息的相关性的方法,在所述表格中包含多个模块,所述多个模块中的至少一个模块包含表示表头的数据,所述多个模块中的其余模块包含与表头信息关联的数据,所述方法包括以下步骤:
存储多个模板,所述模板具有多个节点、分别与所述多个节点关联的字符数据、以及所述多个节点之间的相对位置信息;
获取所述指定表格中的所述多个模块中包含的数据;
确定所述多个模块的相对位置,以生成相对位置信息;
与所述模板的所述字符数据和所述多个节点的所述相对位置信息相比较地,分析从所述多个模块获取的所述数据和所述多个模块的所述相对位置信息;以及
确定所述多个模块中包含的所述数据的相关性。
5、根据权利要求4所述的方法,其中,所述关联是所述多个模板之间的层级关系。
6、根据权利要求5所述的方法,其中,所述节点与下位层级中的所述多个模板关联,
所述方法还包括以下步骤:检测所述下位层级中的所述模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810004819.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种真空机自动安全阀及真空机
- 下一篇:一种清洁方便的轴承旧脂泵出装置