[发明专利]一种局部色调差异的自然场景文字定位方法有效
申请号: | 201310377443.8 | 申请日: | 2013-08-27 |
公开(公告)号: | CN103440487B | 公开(公告)日: | 2016-11-02 |
发明(设计)人: | 李宏亮;黄自力;姚源;许静;孟凡满;吴庆波;黄超 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 局部 色调 差异 自然 场景 文字 定位 方法 | ||
技术领域
本发明属于图像处理和计算机视觉技术领域,特别涉及一种自然场景文字定位方法。
背景技术
将场景图片中文字进行自动的检测,分割,识别出来,将对人们的信息获取提供非常大的帮助,也对图像的语义信息的自动理解以及检索有着非常重要的意义。在车载导航系统中,如果能自动的对前方的路标、商铺名称、交通标志等进行定位,识别,那么将为人们的出行提供安全保障,可以提醒驾驶员减速,以及正确的行车路线。多媒体以及计算机的高速发展中,图片以其形象深刻的特殊形式成为传输的重要介质,基于关键词的检索已经不能满足人们的需求,而基于图片内容的检索,已经成为发展的趋势,检索中,文字的定位,识别成为关键的技术,引来越来越多学者的关注,同时文字定位可以为盲人的阅读提供辅助帮助。
在对场景中文字定位的现有方法的综合学习中,文字定位的方法大致可以分为两种方法:1、基于纹理的文字定位方法;2、基于区域的文字定位方法。基于纹理的文字定位方法,就是利用纹理特征来区分开文字和非文字,将一个或一块区域中是文字的聚类到一起,这种方法的鲁棒性好,但是也造成了算法的复杂度较高。基于区域的文本定位方法,就是依据一块区域的像素符合某种相似性来区分开文字与非文字,比如,可以根据区域内颜色的一致性作为特征,来分开文本以及背景区域,这种方法简单,但是一种特征往往不能满足所有的分类,鲁棒性不足,在处理复杂背景的场景图片表现中不好的效果。
发明内容
本发明所要解决的技术问题是,提供一种能有效对自然场景中文字进行定位,同时速度较快,实用性较强的文字定位方法。
本发明为解决上述技术问题所采样的技术方案是,一种局部色调差异的自然场景文字定位方法,包括以下步骤:
1)通过分类器对场景图片进行扫描,以得到候选文字区域对应的候选框;
2)将场景图片转化为HSI颜色模型,提取色调H分量,计算所有候选框box(i)与相邻区域的主色调差异hue_aver:
其中,box_domihue(i)为第i个候选框box(i)的主色调,box_neighbour_domihue(i)为与候选框box(i)相邻区域的主色调;N为当前场景图片中候选框总数;
3)取场景图片中边缘像素点,求各候选框中所有边缘像素点与邻居像素点间的平均色调差local_hue(i);
4)比较各候选框对应的平均色调差local_hue(i)与主色调差异hue_aver的大小,当候选框对应的平均色调差local_hue(i)大于主色调差异hue_aver,则将视当前候选框为包含文字的区域,否则舍弃当前候选框;所有候选框判断完毕后,最终的场景文字定位完成。
本发明不仅利用了文字的纹理特征,而且利用了文字区域与周围区域色调不同的特点,有效地对场景中的文字进行定位。通过取边缘像素点附近的平均色调差,利用该平均色调差与阈值相比较来判断该区域是否含有文字,这样做可以加入区域文字的局部颜色信息,利用文字的颜色一致性与背景的不同来定位文字。且本发明利用自适应的阈值处理方法来得到阈值,该阈值是由所有候选框的上下左右区域的主色调差的平均值得到的,这样做的目的是利用整幅图的颜色信息来为局部颜色信息做贡献,得到的阈值可以表征场景图的文字区域与背景的色调差。
本发明的有益效果是,能较快地对自然场景中文字进行准确定位。
附图说明
图1:实施例候选框处理流程示意图;
图2:输入的自然场景图片
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310377443.8/2.html,转载请声明来源钻瓜专利网。