[发明专利]地址识别装置有效
申请号: | 200710091539.2 | 申请日: | 2007-03-27 |
公开(公告)号: | CN101276327A | 公开(公告)日: | 2008-10-01 |
发明(设计)人: | 黄开竹;孙俊;堀田悦伸;藤本克仁;直井聪;龙翀;庄丽;朱小燕 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06K9/00 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 孙海龙 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 识别 装置 | ||
技术领域
本发明涉及地址识别的装置。更具体地,涉及一种识别任意间距区域内的手写字符地址的地址识别装置。
背景技术
传统上有两种对手写地址进行识别的方法。
第一种传统方法是首先从输入地址图像中提取单字符区域(即只含有一个字符的区域),并从这些单字符区域中提取关键字符(在手写地址识别中,关键字符为能够表示行政区域的单一字符,例如省、区、州、市、县、镇、乡、村等),检测由两个相邻关键字符所限定的地名区域。为了识别地名区域内的地名,该方法将该地名区域分割成独立的字符,然后逐个识别这些独立字符。
但是,这种传统的地址识别方法存在一定的缺陷,即,将地址分割成独立字符时常常出现错误。特别是当自由间距区内的地址相互连接紧密时,该方法尤其容易出错。而由于手写字符常常不太规范、形态各异,所以这种紧密连接的情况很常见。
第二种传统方法也是首先提取字符片断,并检测由两个相邻关键字符所限定的地名区域。它与第一种方法的不同之处在于,这种方法将地名区域内的地名作为整体来进行识别。比如输入地址图像的实际地址为“北京市朝阳区霄云路”,首先市,区,路这些关键地址被提取识别出来。然后这些关键字之间的图像(或第一个关键字之前的图像)被切分出来。即,“北京”,“朝阳”,“霄云”所对应的图像将被切分出来。并对这些图像整体识别。
这个传统方法的一个主要问题是,很大一部分实际地址中,关键字往往被省去。比如,地址条“北京市朝阳区霄云路”中的“市”或“区”可以被略去,而且并不会影响对地址的解读。在这种情况下,整体识别的方法会失败,因为地名区域也即关键字之间的图像区域将无法确定。
发明内容
本发明鉴于上述问题而提出。本发明的目的是提供对地址进行识别的地址识别装置,用以解决现有技术中的一个或更多个问题。
为了实现本发明的目的,根据本发明的第一方面,提供了一种地址识别装置,所述装置包括以下单元:关键字缺失判断单元,判断输入的地址图像中关键字是否缺失;整体地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字不缺失时,对所述关键字之间的地址区域进行整体识别;词语言地址识别单元,在所述关键字缺失判断单元判断出所述输入的地址图像中关键字缺失时,对所述输入的地址图像进行词语言地址识别。
根据本发明的第二方面,提供了一种确定字符图像中单字符区域的装置,所述装置包括以下单元:连通域分割单元,对所述字符图像进行连通域分割;候选单字符区域判断单元,判断每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域的宽度是否大于阈值,将大于阈值的每一个连通域、每相邻的俩个连通域以及每相邻的三个连通域判断为候选单字符区域。
根据本发明的第三方面,提供了一种对地址图像中的地址进行识别的装置,所述装置包括以下单元:单字字符识别单元,识别所述地址图像中的每一个候选单字符区域,得到字符识别候选;识别候选阵列获得单元,获得由所有所述候选单字符区域的字符识别候选所组成的识别候选阵列;匹配单元,将地址字典中的地址与所述识别候选阵列进行匹配,将识别距离最小的地址识别为识别结果。
本发明在字符分割时,每个连通组件,每俩个相邻的连通组件及每三个相邻的连通组件,都将作为可能的字符区域被分别识别。基于词图搜索的方法则从得到的识别候选序列中搜索最优的识别地址。使用多个连通组件的组合提高了系统的鲁棒性,从而降低丢失正确字符的风险,提高地址识别的正确度。
本发明能够有效地识别存在关键字和不存在关键字的地址。
另外,本发明在基于词图搜索的地名匹配方法中,采用了一种加权词图的搜索方法。关键字与普通汉字相比往往能提供更多的信息。当关键字存在时,这种方法突出了关键字的作用,即,给予含关键字的地名以较大的权值。另外,中文地址中,低级地名一般不会缺失关键字。比如,北京市朝阳区霄云路中,“市”、“区”可能会被省去,但“路”一般不会被省去。考虑加权关键字能提高识别地址识别的效率和正确率。
应当理解,以上总体说明和以下详细说明都是说明性和示例性的,并旨在提供对所要求的本发明的进一步说明。
附图说明
所包含的附图用于提供对本发明的进一步理解,其被并入说明书并构成其一部分,附图说明了本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是依据本发明的一个实施例的地址识别装置的方框图;
图2示出了依据本发明一个实施例的地址识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710091539.2/2.html,转载请声明来源钻瓜专利网。