[发明专利]一种自适应图像文本信息提取方法有效

专利信息
申请号: 200810115615.3 申请日: 2008-06-25
公开(公告)号: CN101615252A 公开(公告)日: 2009-12-30
发明(设计)人: 李敏花;肖柏华;王春恒;戴汝为 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06K9/20 分类号: G06K9/20;G06K9/46
代理公司: 中科专利商标代理有限责任公司 代理人: 周国城
地址: 100080北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明一种自适应图像文本信息提取方法,涉及图像中的文本信息提取技术,其包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示。本发明方法,通过计算图像背景复杂度,对不同复杂度背景的图像采用不同的文本检测方法,减少了采用单一文本检测方法中的漏检,误检现象,提高了文本提取系统的整体性能。本发明方法中图像背景复杂度的计算方法简单,有效,不仅能够检测出不同背景复杂度的图像中的文字信息,而且检测出的文本信息不受字体,大小及语言的影响,具有很强的通用性。
搜索关键词: 一种 自适应 图像 文本 信息 提取 方法
【主权项】:
1、一种自适应图像文本信息提取方法,其特征在于,包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示;其具体步骤为:A)首先,从选定的路径中读取图像,并将彩色图像转换为灰色图像;B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背景复杂度,计算方法为:某一像素点P0的灰度强度S′按照下式计算:S′=MAX{|P1-P8|,|P2-P7|,|P3-P6|,|P4-P5|} (1) <mrow> <mi>S</mi> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mfrac> <msup> <mi>S</mi> <mo>&prime;</mo> </msup> <mn>255</mn> </mfrac> <mo>,</mo> </mtd> <mtd> <mi>S</mi> <mo>&GreaterEqual;</mo> <mi>T</mi> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> <mo>,</mo> </mtd> <mtd> <mi>Otherwise</mi> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>则图像的背景复杂度为: <mrow> <mi>D</mi> <mo>=</mo> <mfrac> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </munder> <mi>S</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> <mi>n</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>其中,S′为图像中像素点P0的灰度强度,S按照(2)式将S′归一化为(0,1)范围内的数,T为归一化的阈值,D为图像的背景复杂度值,n为图像中的像素数目,P1~P8为P0的八邻域;按照计算的D值对图像背景复杂度进行分级;C)根据图像复杂度级别决定采用何种文字边缘检测方法,对于复杂度较低的图像,采用较简单的边缘文本检测方法,对于复杂度较高的图像,采用较复杂的边缘文本检测方法;D)根据采用的文本检测方法,找出图像中的候选文本区域,对文本信息区域进行初始定位;E)对从图像中找到的候选文本区域,抽取相关特征进行文本区域验证,通过验证的候选文本区域,即判定为文本块,将在后续的步骤中抽取文本信息,未通过验证的候选文本区域,即判定为非文本区域,将其从候选文本中去除;F)对确定的文本块,去除文本块中的背景,将所有文本信息抽取出来;G)将图像中抽取出来的所有文本信息输出给下一级处理,或在计算机上显示出来。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810115615.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top