[发明专利]一种用以增强文字与背景差异的边缘响应统计变换方法有效

专利信息
申请号: 201610850397.2 申请日: 2016-09-26
公开(公告)号: CN106650579B 公开(公告)日: 2019-06-14
发明(设计)人: 宋永红;贺翔;张元林 申请(专利权)人: 西安交通大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/20;G06K9/32
代理公司: 西安智大知识产权代理事务所 61215 代理人: 何会侠
地址: 710049 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用以 增强 文字 背景 差异 边缘 响应 统计 变换 方法
【说明书】:

发明公开一种用以增强文字与背景差异的边缘响应统计变换方法,1、对于一副输入的包含文本的自然场景图像,计算该图像中的边缘包围框,依据边缘包围框的分数对所有边缘包围框递减排序,按照文字边缘在所有物体边缘目标中的分布特性对排序后的边缘包围框进行筛选,并对筛选后得到的包围框集合进行加权求和计算,得到边缘响应特征图;2、在边缘响应特征图上按行方向依次累加响应值,得到行方向上的统计边缘响应图,简称行统计图;对行统计图计算梯度,得到反映响应值变化强烈程度的梯度图;对梯度图取正,并使其与行统计图量纲统一,并执行非极大值抑制操作,得到文本行粗定位结果;本发明降低了处理难度和计算量;此外文本行的定位为后续的文字识别、多语种翻译、图像内容理解等应用提供数据基础。

技术领域

本发明属于自然场景图像文本检测领域,具体涉及一种用以增强文字与背景差异的边缘响应统计变换方法。

背景技术

自然场景图像中的文本检测是一种从自然场景中拍摄的图片中定位出文本行的技术。该技术对于基于内容的互联网搜索、视觉辅助、翻译及无人驾驶汽车等领域都有广泛的应用。如果直接对自然场景中的文字进行识别(例如采用光学字符识别技术OCR),会因为拍摄的图像中可能包含许多复杂背景(例如树叶、砖墙、栅栏等)而导致大量的误检,使得文本的识别效果极差。

因此为了提高文本识别的准确率,领域内通常采用的方法是先使用文本定位技术在原图中将文本行区域提取出来,然后进行OCR等识别处理。但同时自然场景图像中的文本检测也存在一些挑战,主要包括以下难点,首先是图像质量差,受拍摄条件制约会使图像中的文本区域因模糊、遮挡、反光等原因导致普通的文本检测方法失效。另外一个难点是文本本身的形态差异,例如浮雕碑文,低分辨率以及艺术字等问题。

自然场景图像文本检测领域包含两类主流方法:基于多尺度滑动窗扫描的文本检测和基于连通区域提取的文本检测。多尺度滑动窗法采用分类器对图像金字塔上的每个区域进行文字与非文字二分类,虽然检测精度较高但庞大的计算量影响了实时性能。连通区域提取方法是一种轻量、高效的图算法,通过假设属于同一字符的像素具有类似的特征(如灰度、颜色、SWT和MSER等)而将这些像素聚集成文字连通区域,其运算量不取决于文本的尺度范围、方向及字体等属性,因此时间性能优于滑动窗。缺点是对聚合、粘连、抖动模糊、光照变化及极端文字尺寸等改变连通区域结构的场景敏感。

发明内容

本发明针对上述问题,提出了一种用以增强文字与背景差异的边缘响应统计变换方法,该方法在输入图像中计算边缘包围框,进行边缘响应变换,得到了文本区域与背景区域间响应值差异获得明显增强的边缘响应特征图,然后对边缘响应特征图执行简单的求取梯度、非极大值抑制等操作,即能够从输入图像中定位出文本行的位置。相比于多尺度滑动窗扫描类方法和连通区域提取类方法,本方法无需算法复杂的文字检测算子,时间复杂度降低、实时性能好。同时本方法因为在统计层面上对计算得到的边缘包围框执行排序、筛选等操作,故能够对具有复杂背景的图像中的文本行呈现鲁棒的定位结果。

为了达到上述目的,本发明采用如下技术方案:

一种用以增强文字与背景差异的边缘响应统计变换方法,包括以下步骤:

步骤A:对于一副输入的包含文本的自然场景图像,计算该图像中的边缘包围框,其中边缘包围框是指对图像中边缘目标可能存在的位置用矩形包围框标注,而边缘目标既包含文字边缘目标,也可能包含其它物体边缘目标;依据边缘包围框的分数对所有边缘包围框递减排序,其中边缘包围框的分数由包围框内完全包含的轮廓个数来确定;按照文字边缘在所有物体边缘目标中的分布特性对排序后的边缘包围框进行筛选,并对筛选出的边缘包围框集合进行加权求和计算,其中权值由反比例函数确定;得到边缘响应特征图;

步骤B:在边缘响应特征图上按行方向累加响应值,得到行方向上的统计边缘响应图,简称行统计图;对行统计图计算梯度,得到梯度图;对梯度图取正,并使其与行统计图量纲统一;对量纲统一后的梯度图执行非极大值抑制操作,得到文本行粗定位结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610850397.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top