[发明专利]一种自适应图像文本信息提取方法有效

专利信息
申请号: 200810115615.3 申请日: 2008-06-25
公开(公告)号: CN101615252A 公开(公告)日: 2009-12-30
发明(设计)人: 李敏花;肖柏华;王春恒;戴汝为 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06K9/20 分类号: G06K9/20;G06K9/46
代理公司: 中科专利商标代理有限责任公司 代理人: 周国城
地址: 100080北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自适应 图像 文本 信息 提取 方法
【权利要求书】:

1.一种自适应图像文本信息提取方法,其特征在于,包括步骤:1) 图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5) 文本抽取;6)文本信息输出或显示;

其具体步骤为:

A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;

B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背 景复杂度,计算方法为:某一像素点P0的灰度强度S′按照下式计算:

S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|}   (1)

S=S255,ST0,Otherwise---(2)]]>

则图像的背景复杂度为:

D=Σi,jS(i,j)n---(3)]]>

其中,S′为图像中像素点P0的灰度强度,S按照(2)式将S′归一化为 (0,1)范围内的数,T为归一化的阈值,D为图像的背景复杂度值,n为 图像中的像素数目,P1~P8为P0的八邻域;

按照计算的D值对图像背景复杂度进行分级;

C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂 度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像, 采用较复杂的边缘文本检测方法;

D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本 信息区域进行初始定位;

E)对从图像中找到的候选文本区域,抽取相关特征进行文本区域验 证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取 文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候 选文本中去除;

F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出 来;

G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算 机上显示出来;

所述B)步中,对图像背景复杂度进行分级,是分为低、中、高三级: 如果0≤D≤0.15,则图像背景复杂度为低级;如果0.15<D≤0.3, 则图像背景复杂度为中级;如果0.3<D≤1则图像背景复杂度为高级;

所述C)步中,对于复杂度较低的图像,采用较简单的边缘检测方法, 对于复杂度较高的图像,采用较复杂的边缘检测方法,是:

如果图像背景复杂度判定为低,则采用边缘特征抽取方法1:在灰度 图像上用Sobel四方向算子求取边缘并抽取特征;如果图像背景复杂度 判定为中,则采用边缘特征抽取方法2:基于形态学的方法在灰度图像 上求取形态边缘并抽取特征;具体方法为:首先选用3*3的结构算子, 按照公式(5)对灰度图像进行膨胀运算得到膨胀图像,然后按照公式 (6)对灰度图像进行腐蚀运算得到腐蚀图像,最后按照公式(7)对膨 胀图像和腐蚀图像求差分得到边缘图像:

I(x,y)Sm,n=max|i|m/2,|j|n/2I(x-i,y-j)Sm,n(x,y)---(5)]]>

I(x,y)Sm,n=min|i|m/2,|j|n/2I(x-i,y-j)Sm,n(x,y)---(6)]]>

D(I1,I2)=I(x,y)Sm,n-I(x,y)Sm,n---(7)]]>

其中Sm,n(x,y)为进行形态学的结构元素,I(x-i,y-j)为与结构元素对应的图像中的 点;如果图像背景复杂度判定为高,则采用边缘特征抽取方法3,采用 彩色形态学边缘检测方法求取边缘并抽取特征,具体的求取方法为:首 先按照公式7,分别对彩色图像的R,G,B三个颜色通道求取梯度图像, 然后按照公式(8)求取边缘图像:

E(x,y)=Σj=1nωjGj(x,y)]]>j=R,G,B    (8)

其中,Gj(x,y)为在第j通道求得的梯度图象,ωj为第j通道对应的权重, E(x,y)为最后求得的边缘图象;

所述D)步中,找出图像中的候选文本区域,是:

a)提取图像的边缘并抽取特征后,在边缘图像上进行连通域分析,获 得图像上所有的连通元;

b)利用边缘特征和几何特征对连通元进行筛选,剔除非文本连通元;

c)对每个文本连通元的位置和尺寸进行分析,将在同一行或同一列的 文本连通元组合,形成候选文本区域;

所述E)步中的相关特征,为文本区域中字符宽度的均值和方差,通过 将文本行或文本列的二值图像向水平方向和竖直方向投影,投影曲线上有 明显的波峰和波谷,通过统计相邻波谷之间的距离,计算字符的平均宽度 和方差;

所述F)步中,将所有文本信息抽取出来,是采用二值化的方法、颜色 聚类的方法或统计模型的方法抽取所有文本信息。

2.如权利要求1所述的方法,其特征在于,所述b)步中的边缘特征 和几何特征,其中,边缘特征是边缘密度特征和边缘方向特征,几何特征 是连通元的长,宽,宽高比,占空比。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810115615.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top