[发明专利]文字识别装置无效
申请号: | 99123281.X | 申请日: | 1999-11-01 |
公开(公告)号: | CN1273401A | 公开(公告)日: | 2000-11-15 |
发明(设计)人: | 伊崎保直;镰田英夫;坂根俊司;井出克美 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 于静 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 装置 | ||
本发明涉及将被输入的文字图像作为文字进行识别的文字识别装置。
以往,在将被输入的文字图像作为文字进行识别的文字识别装置的领域中,例如OCR(光学式文字读取装置)或者组合图像扫描仪和OCR软件的文字识别装置等在应用领域广泛使用。在以往的OCR用票单中,使用印刷有每单个文字的文字填写框的票单,在使用汉字的系统中文字填写框的大小也采用容易填入汉字那样大小的文字填写框。由此具有对于OCR来说容易正确地识别被填入的文字,对于填写者来说促使其在填写文字时不要和相邻的文字接触的效果。
但是,随着OCR利用领域的进一步扩展,对于用一般所使用的通常的票单那样的小的票单不受文字框限制地被填入的文字列,即,在通常的传票等上以不规则的文字间隔、不规则的填入方法填入的相邻文字之间相互接触那样的低品质的手写文字列,也要求有可以以实用的识别精度识别的文字识别装置。
另外,在印刷的文字列的情况下,要使用如OCR-B或者多字体等那样只用多个特定的字体精心印刷的OCR票单,但对于被印刷的文字列,也希望一种文字识别装置,其可以从用不特定的印字装置以多样的文字间距印刷的,有多种变形的文字列,例如用文字间距窄的印字装置或者用比例间距印刷的文字列,或者半角文字和全角文字混合存在的文字列等中以实用的识别精度分离文字列。
在以往的文字识别装置中的文字分离方式,特别在从自由间距的文字列,即未设定文字框的字段中分离出文字的文字分离方式中,采用对于孤立的黑象素的连接区域求出文字列的高度信息,从其高度信息中求出文字的间距信息,用该值合并或者分离相邻的文字,从而分离出应该作为识别对象的单个文字的方式。或者采用将1行、1字段的文字列投影到与行方向、字段方向垂直的方向上,从文字列的高度信息中求文字的间距信息,用该值从投影直方图中分离出文字位置的方式。当其分离位置不能确定为一种的情况下也可以求多种的分离位置。
通常,收集根据预先由不特定的多位书写者确定的笔迹填入的文字,从这些文字中抽出依据识别方式的文字图案的特征用统计的方法等制成标准图案。另外,标准图案,也有从被收集的文字中制成平均图案的。在手写文字的情况下,因为因书写者不同而产生大的文字变形所以对于各种字制成多种标准图案。通常将一种标准图案称为模板,将收集了多种标准图案的词典称为多模板词典。作为词典核对方法,采用从由输入票单中分离出的单个文字中抽出该文字图案的特征,在该特征和标准图案词典的模板的特征之间进行近似度计算或者距离计算,将具有最大近似度的类型或者具有最小的距离的模板的类型作为识别结果求出的方法。作为候补文字列,按照距离小的顺序求例如将8位作为候补文字列。
对于印刷文字也可以使用同样的方法求候补文字列。当有多种候补的情况下可以采用用图案之间的类似度评价值,或者用知识处理等的语言处理确定最佳的分离候补的方法。
一般,当识别在通常的传票上用如手写输入那样的自由间距填入的文字列,或者用非特定的印字装置印刷的文字列的情况下,多是相邻的文字之间接触,另外在印刷文字列的情况下有半角文字和全角文字混合存在的情况,由于相邻的文字之间大多接触,所以在检出每一个文字识别的方法中,很难判断到什么范围为单个文字,实现在实用中可以容忍的识别精度很难。还有由平假名、片假名,以及在汉字中有偏(汉字的左边)和旁(汉字的左边)原本就分离出的文字区域组成的文字,如果不能正确地识别这些文字区域也就连是用哪种文字写入的都不能判断。
在印刷文字列的文字分离中,作为从1行文字列推定各个文字的间距的方法提出了以下的各种方法。
第1种方法,将1行文字列的黑象素投影在行方向上求构成行的文字的平均高度。接着,将文字列的黑象素投影在与行方向垂直的方向上将黑象素的行方向的频度作成直方图表示,从其直方图中求频度为0的位置,即文字列被间断切成的位置,或者应该切断的直方图极小点,即接触文字或者重叠文字的切断候补位置。根据该切断候补位置,将根据前面求出的文字列的平均高度准确看出全角文字、半角文字列的位置作为文字分离位置。
第两种方法,将1行文字列的黑象素投影在与行方向垂直的方向上将黑象素的行方向的频度制成直方图表示,从该直方图中求频度为0的位置,或者直方图的极小点,对于该文字列求多种被推定为文字分离位置的位置。多种文字分离位置中的某一个是最接近的文字分离位置的判定,靠文字列的类似度评价和识别结果的判断确定。
第3种方法,对1行文字列求黑象素的连接区域,对于连接区域的排列小的区域之间合并,大的区域被分成多个段确定单个文字的区域进行文字分离。此时的小区域,大区域的判断根据文字列的高度进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99123281.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:CMOS半导体集成电路
- 下一篇:磺基聚酯染料在获得抗摩擦膜中的应用