[发明专利]用于处理图像以识别一连串字母数字字符的系统和方法有效
申请号: | 201310098006.2 | 申请日: | 2013-03-25 |
公开(公告)号: | CN103366167B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 塔努沙姆·查托帕迪艾;乌杰瓦尔·巴塔查里亚;比迪亚特·巴拉恩·乔杜里 | 申请(专利权)人: | 塔塔顾问服务有限公司;印度统计研究院 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 余刚,吴孟秋 |
地址: | 印度*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 图像 识别 一连串 字母 数字 字符 系统 方法 | ||
技术领域
本发明总体上涉及用于进行字符识别的方法和系统。更具体地,本发明涉及用于识别图像内存在的一连串字母数字字符的方法和系统。
背景技术
在某些特别的情况下,为了某些特定的目的,人们用移动电话照相机多次拍摄车辆识别码(VIN)的图像。在拍摄的过程中进行的人工干预、照明不均匀并且不足以及复杂的聚焦系统的无效导致产生劣质图像。
由于图像质量受到各种噪声的影响,所以由移动电话拍摄的VIN图像上的可用开放源码光学字符识别(OCR)系统的性能极差。因此,在将扫描图像作为输入提供给光学字符识别系统之前,需要使用图像增强技术。二值化技术用作图像增强技术,以从复杂的背景(更具体地,背景文本)中获得文本区域。
移动电话拍摄的图像内的文本的OCR具有各种缺点。在现有系统中,需要提取嵌入式移动平台上的各个字符,该平台具有低存储和处理速度。二值化技术用作图像增强技术,以从复杂的背景(更具体地,背景文本)中获得文本区域。已经提出许多种二值化技术,来提高图像的识别准确度。现有的二值化技术仅可将图像的识别准确度至多提高至5.89%。
因此,需要能够提供合适的低复杂度二值化技术的系统和方法,该技术将更大程度上提高图像的识别准确度。
本发明的目的
本发明的主要目的在于,提供一种用于识别图像内存在的一连串字母数字字符的系统和方法。
本发明的另一个目的在于,提供一种将这样拍摄的图像进行二值化的系统和方法。
本发明的又一个实施方式在于,提供一种用于从二值化图像中去除不需要的、过度分割和分割不足的部分的系统和方法。
本发明的又一个目的在于,提供一种用于应用形态闭合以将有效的字母数字字符内的多个元素标签合并的系统和方法。
发明内容
本发明提供了一种用于识别图像内存在的一连串字母数字字符的方法。所述方法包括处理器,其执行以下步骤:拍摄包括一连串字母数字字符的图像并且处理图像,以从所述一连串字母数字字符中产生一组可识别字符。所述处理进一步包括:计算图案,以在图像中识别像素强度分布,从而确定背景峰值和前景峰值;通过选择背景峰值和前景峰值之间的多个动态阈值,生成多个二值化图像;并且通过从多个图像中去除不需要的元素,过滤所生成的二值化图像,以识别一个或多个有效字符。所述处理进一步包括:通过比较有效字符和已知的基础真值,识别一个或多个候选图像;通过组合候选图像,生成最终的候选图像,从而候选图像的组合取决于预定的条件;以及将最终的候选图像分成预定的部分,并且识别与其内的每个部分相关联的有效字母数字字符。
本发明还提供了一种用于识别图像内存在的一连串字母数字字符的系统。所述系统包括:图像拍摄装置,用于拍摄包括一连串字母数字字符的图像;以及处理器,其被配置成从所述一连串字母数字字符中产生一组可识别的字符。所述处理器进一步包括:计算模块,其被配置成计算图案,以在图像中识别像素强度分布,从而确定背景峰值和前景峰值;二值化模块,其被配置成通过选择背景峰值和前景峰值之间的多个动态阈值,生成多个二值化图像;以及滤波器,其被配置成从多个图像中去除不需要的元素,以识别一个或多个有效字符。所述处理器进一步包括:比较器,其被配置成比较有效字符和已知的基础真值,以识别一个或多个候选图像;以及图像生成器,其被配置成通过组合候选图像,生成最终的候选图像,从而候选图像的组合取决于预定的条件。所述系统进一步包括输出生成模块,其被配置成将最终的候选图像分成预定的部分,并且识别与其内的每个部分相关联的有效字母数字字符。
附图说明
图1示出了根据本发明实施方式的系统架构;
图2示出了根据本发明可替换实施方式的示范性流程图。
图3示出了在应用根据系统的可替换实施方式的形态闭合(closing)之后的图像的形式;
图4示出了根据本发明实施方式的本发明的二值化技术和现有技术的二值化技术的比较分析。
具体实施方式
现在,将讨论本发明的某些实施方式,这些实施方式示出了本发明的特征。
词语“包括(comprising)”、“具有(having)”、“包含(containing)”和“含有(including)”及其的其他形式意旨具有相同的意义,并且是开放用语,即,这些词语中的任一个之后的一项或多项并不表示该项或这些项的详尽列表,也并不表示仅仅限于所列出的一项或多项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塔塔顾问服务有限公司;印度统计研究院,未经塔塔顾问服务有限公司;印度统计研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310098006.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序