[发明专利]帐票识别装置、方法、数据库生成装置、方法以及程序有效
申请号: | 200910149359.4 | 申请日: | 2009-06-18 |
公开(公告)号: | CN101685498A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 江口真一;川岛哉;金元浩一;长谷川将平;小原胜利;矢吹真纪 | 申请(专利权)人: | 富士通先端科技株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种不用将用于识别记载内容的信息按照设计不同的各个帐票进行登记即能范围广泛地应对帐票的帐票识别装置、方法、数据库生成装置、方法以及程序。关键字提取部(17)提取与项目名等对应的标题语句作为关键字。帐票类别判定部(18)着眼于所提取的关键字的种类、该关键字的提取位置等来判定帐票类别。逻辑结构分析(项目候补提取)部(20)以包含有字符串的区域即单元格为单位对表结构进行逻辑分析,提取单元格内存在的其他未识别的字符串,估计未识别的标题语句并进行恢复。这些操作通过反映帐票类别的判定结果来进行。由此,可实现更高精度的识别,并能应对范围更广的种类的帐票。 | ||
搜索关键词: | 识别 装置 方法 数据库 生成 以及 程序 | ||
【主权项】:
1.一种帐票识别装置,该帐票识别装置对在帐票上任意的表结构内存在的字符串进行识别,其特征在于,该帐票识别装置具有:图像取得单元,其取得所述帐票进行了电子化后的帐票图像;字符串识别单元,其识别在所述图像取得单元所取得的所述帐票图像上存在的字符串;字符串提取单元,其从所述字符串识别单元所识别的字符串中提取预定的字符串即标题语句;表结构判定单元,其根据所述字符串提取单元所提取的标题语句、以及所述标题语句在所述帐票图像上的配置,判定在该帐票图像上存在的表结构;以及对应关系确定单元,其使用由所述表结构判定单元进行的所述表结构的判定结果,确定所述标题语句与在该标题语句以外由所述字符串识别单元所识别的字符串之间的对应关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通先端科技株式会社,未经富士通先端科技株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910149359.4/,转载请声明来源钻瓜专利网。