[发明专利]一种自适应图像文本信息提取方法有效
申请号: | 200810115615.3 | 申请日: | 2008-06-25 |
公开(公告)号: | CN101615252A | 公开(公告)日: | 2009-12-30 |
发明(设计)人: | 李敏花;肖柏华;王春恒;戴汝为 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
地址: | 100080北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 图像 文本 信息 提取 方法 | ||
技术领域
本发明涉及模式识别与机器视觉领域中的文本信息提取技术领域,具 体地是一种自适应图像文本信息提取方法。
背景技术
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用, 图像中信息越来越引起人们的关注,然而计算机理解图像的内容,目前还 很困难。图像中嵌入的文字能够提供一些人们所要的重要信息,如书的封 面、视频、自然风景图片www网页的彩图等等,它对理解图像中的内容有 着重要的帮助。让计算机像人类一样识别图像中的文字,即文字的自动检 测系统,近年来越来越引起了人们的关注,它对于图像的存储、分类和检 索等来说具有极其重要的意义,有着广泛的应用前景和商业价值。在许多 情况下,图像中的场景文字甚至成为图像最主要、最关键的信息,例如对 于车牌的识别,对于路牌的识别和翻译等。这些场景文字被抽取后,送入 OCR模块,转换成计算机可理解的内码,可以方便的进行后续的各种处理。
国内外的研究人员是在近几年内才开始对图像中的文本信息提取技 术进行研究的,由于文本信息提取受到语种、文字分辨率、文字间距、分 布情况、文字的背景、光照、颜色之类因素的影响,并且某些图案、纹理 的背景很难与文字区分开来,因此图像中的文本信息提取技术目前还没有 一个很好的解决办法。
目前对这个问题提出一些解决的方法,大致可以分为四类:基于边缘 的方法,基于纹理的方法,基于颜色的方法和基于连通区域的方法。基于 边缘的方法主要是利用图像中文字和背景通常存在较大的颜色差,因而在 文字和背景存在明显的边缘。基于边缘的方法就是通过寻找排列规则的边 缘,从而寻找文字区域;基于纹理的方法是把文字当成一种特殊的纹理, 根据文字纹理具有的某种特定频率和方向信息来确定图像中可能的文字 区域;基于颜色的文本信息提取方法利用了大多数图像文字具有均匀颜色 这一事实,通过颜色约减的方法可以将原图分解成属于若干个不同颜色的 子图,然后在各个子图上独立进行文字提取工作;基于连通区域的方法主 要是在图像上通过寻找一致性区域来寻找文字区域,基于连通域的方法利 用了文字的排列特性,即绝大多数情况下文字是成组出现的,例如多个字 母组成一个单词,或者多个汉字组成一个句子。属于同一组的文字会具有 比较统一的几何尺寸和排列规则。
上述现有的研究方法,基于边缘的文本提取方法计算简单,但由于采 用单一的边缘检测方法,当文字和背景对比度相差不大的情况下检测效果 并不理想;而且,倘若背景轮廓和字符粘连,也容易得到错误结果。这就 需要结合其它的信息来扩大检测范围;基于纹理的文本提取方法需要抽取 有效的纹理特征,虽然可有效地检测出文字所在区域,但是也会提取出具 有类似纹理的背景区域,需要结合其它特征;基于颜色聚类方法的主要难 点在于无法预知文字和背景的颜色,因而也就难以确定颜色子图的个数, 聚类数过多或者过少都会影响提取性能,而且计算量很大;基于连通区域 的方法大多数情况下不能单独使用,一般用在边缘、纹理和颜色等方法之 后。
上述各种方法进行文字信息提取时,都没有考虑到图像背景的复杂度 和文字、背景的对比度情况,对不同背景复杂度的图像,都采用单一的提 取方法,容易漏掉一些对比度弱的文本区域或者将似文本区域错误提取出 来,造成整体提取效果不好。
发明内容
本发明的目的是提供一种自适应图像文本信息提取方法,根据图像背 景复杂程度,采用不同的图像文本检测技术,快捷、准确、有效的检测出 不同背景复杂度图像中的文字信息,而且检测出的文本信息不受字体,字 体大小及语言的影响,具有很强的通用性。
为达到上述目的,本发明的技术解决方案如下:
一种自适应图像文本信息提取方法,其包括步骤:1)图像预处理;2) 图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6) 文本信息输出或显示;
其具体步骤为:
A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;
B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背 景复杂度,计算方法为:某一像素点P0的灰度强度S′按照下式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810115615.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置