[发明专利]一种自适应图像文本信息提取方法有效
申请号: | 200810115615.3 | 申请日: | 2008-06-25 |
公开(公告)号: | CN101615252A | 公开(公告)日: | 2009-12-30 |
发明(设计)人: | 李敏花;肖柏华;王春恒;戴汝为 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
地址: | 100080北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 图像 文本 信息 提取 方法 | ||
1.一种自适应图像文本信息提取方法,其特征在于,包括步骤:1) 图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5) 文本抽取;6)文本信息输出或显示;
其具体步骤为:
A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;
B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背 景复杂度,计算方法为:某一像素点P0的灰度强度S′按照下式计算:
S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|} (1)
则图像的背景复杂度为:
其中,S′为图像中像素点P0的灰度强度,S按照(2)式将S′归一化为 (0,1)范围内的数,T为归一化的阈值,D为图像的背景复杂度值,n为 图像中的像素数目,P1~P8为P0的八邻域;
按照计算的D值对图像背景复杂度进行分级;
C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂 度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像, 采用较复杂的边缘文本检测方法;
D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本 信息区域进行初始定位;
E)对从图像中找到的候选文本区域,抽取相关特征进行文本区域验 证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取 文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候 选文本中去除;
F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出 来;
G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算 机上显示出来;
所述B)步中,对图像背景复杂度进行分级,是分为低、中、高三级: 如果0≤D≤0.15,则图像背景复杂度为低级;如果0.15<D≤0.3, 则图像背景复杂度为中级;如果0.3<D≤1则图像背景复杂度为高级;
所述C)步中,对于复杂度较低的图像,采用较简单的边缘检测方法, 对于复杂度较高的图像,采用较复杂的边缘检测方法,是:
如果图像背景复杂度判定为低,则采用边缘特征抽取方法1:在灰度 图像上用Sobel四方向算子求取边缘并抽取特征;如果图像背景复杂度 判定为中,则采用边缘特征抽取方法2:基于形态学的方法在灰度图像 上求取形态边缘并抽取特征;具体方法为:首先选用3*3的结构算子, 按照公式(5)对灰度图像进行膨胀运算得到膨胀图像,然后按照公式 (6)对灰度图像进行腐蚀运算得到腐蚀图像,最后按照公式(7)对膨 胀图像和腐蚀图像求差分得到边缘图像:
其中Sm,n(x,y)为进行形态学的结构元素,I(x-i,y-j)为与结构元素对应的图像中的 点;如果图像背景复杂度判定为高,则采用边缘特征抽取方法3,采用 彩色形态学边缘检测方法求取边缘并抽取特征,具体的求取方法为:首 先按照公式7,分别对彩色图像的R,G,B三个颜色通道求取梯度图像, 然后按照公式(8)求取边缘图像:
其中,Gj(x,y)为在第j通道求得的梯度图象,ωj为第j通道对应的权重, E(x,y)为最后求得的边缘图象;
所述D)步中,找出图像中的候选文本区域,是:
a)提取图像的边缘并抽取特征后,在边缘图像上进行连通域分析,获 得图像上所有的连通元;
b)利用边缘特征和几何特征对连通元进行筛选,剔除非文本连通元;
c)对每个文本连通元的位置和尺寸进行分析,将在同一行或同一列的 文本连通元组合,形成候选文本区域;
所述E)步中的相关特征,为文本区域中字符宽度的均值和方差,通过 将文本行或文本列的二值图像向水平方向和竖直方向投影,投影曲线上有 明显的波峰和波谷,通过统计相邻波谷之间的距离,计算字符的平均宽度 和方差;
所述F)步中,将所有文本信息抽取出来,是采用二值化的方法、颜色 聚类的方法或统计模型的方法抽取所有文本信息。
2.如权利要求1所述的方法,其特征在于,所述b)步中的边缘特征 和几何特征,其中,边缘特征是边缘密度特征和边缘方向特征,几何特征 是连通元的长,宽,宽高比,占空比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810115615.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置