[发明专利]逻辑结构分析装置、方法和计算机产品有效
申请号: | 200810145884.4 | 申请日: | 2008-08-18 |
公开(公告)号: | CN101425131A | 公开(公告)日: | 2009-05-06 |
发明(设计)人: | 皆川明洋;堀田悦伸;藤井勇作;藤本克仁 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/72 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 赵淑萍;南 霆 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了逻辑结构分析装置、方法和计算机产品。一种逻辑结构分析装置包括:提取部件,其从表单提取单词候选;第一生成部件,其将每个单词候选分类成标题候选的群组和数据候选的群组,以基于单词候选在表单上的位置,生成第一候选集合,每个第一候选集合包括一个标题候选和可由该标题候选标识的一个数据候选;第二生成部件,其组合第一候选集合,以生成第二候选集合,使得每一个包括多个不同的标题候选和一个数据候选;去除部件,其基于每个第二候选集合中的标题候选和数据单词候选的位置,从第二候选集合中去除包括一数据项和标识该数据项的标题的已确定集合;以及输出部件,其输出已确定集合。 | ||
搜索关键词: | 逻辑 结构 分析 装置 方法 计算机 产品 | ||
【主权项】:
1. 一种计算机可读记录介质,其中存储有逻辑结构分析计算机程序,该逻辑结构分析计算机程序使得计算机执行:从包括一个或多个标题和一个或多个数据项的表单上的字符串中提取单位单词候选;将每个所述单词候选分类成针对所述标题的标题候选的群组和针对所述数据项的数据候选的群组,以基于所述单词候选在所述表单上的位置,生成第一候选集合,每个所述第一候选集合包括所述标题候选中的一个标题候选和所述数据候选中可由所包括的标题候选所标识的一个数据候选;组合所述第一候选集合,以生成第二候选集合,使得每一个包括多个不同的标题候选和所述数据候选中的一个数据候选;从所述第二候选集合中,针对每个所述数据项,去除包括所述数据项中的一数据项和标识该数据项的标题的已确定集合,该去除是基于每个所述第二候选集合中包括的标题候选和数据单词候选在所述表单上的位置的;以及输出所述已确定集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810145884.4/,转载请声明来源钻瓜专利网。
- 上一篇:车辆运用计划编制装置以及方法
- 下一篇:手指静脉认证装置