[发明专利]基于组件树和霍夫森林的文字检测和识别方法有效
申请号: | 201510107607.4 | 申请日: | 2015-03-12 |
公开(公告)号: | CN104778470B | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 于慧敏;李天豪 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 森林 连通域 分类器输出 文字检测 分类器 正样本 层级 尺度 颜色空间转换 独立处理 分布概率 候选区域 后验概率 输出结果 输出文字 输入图像 文字区域 颜色空间 组特征 图像 输出 检测 统一 | ||
本发明公开了一种基于组件树和霍夫森林的文字检测和识别方法,首先,利用组件树提取出具有层级的连通域,同时针对文字本身的特征建立分类器,对分类器输出的正样本进行尺度统一,然后输入至霍夫森林,并以每种字符作为单独的类别,在检测过程中完成识别。对输入图像进行颜色空间转换,并对每一个颜色空间的图像及其补值进行独立处理;通过建立组件树获取具有层级的连通域;每一个连通域分别求取一组特征,并输入至分类器识别;分类器输出的正样本作为候选的文字区域,并放缩至同一尺度大小;每一个候选区域输入至霍夫森林,霍夫森林输出文字的分布概率;根据霍夫森林输出的后验概率,估计文字的位置并输出结果。
技术领域
本发明涉及一种计算机视觉技术领域的文字检测和识别算法,具体为一种基于组件树和霍夫森林的文字检测和识别方法。
背景技术
随着互联网的蓬勃发展,人们获取信息的方式发生了巨大的改变。传统媒体,如报纸、广播等,影响力逐渐让位于互联网的新兴媒体,如社交网络、轻博客等。互联网中的新兴媒体除了更新速度快、传播覆盖面广之外,同时也成为每一个用户自由发布信息的平台。每个人都可通过各类的平台,如微博等,发布消息,通过不断的转发,该消息就可能成为新的热点。图像、视频由于易于理解,符合现代人快速的生活节奏,逐渐取代文本成为主要的信息传播载体。由于微博类网站对文本长度的限制,要发表较丰富的内容通常需要图文结合的方式,同时,图片分享类网站的蓬勃发展,给图像理解领域带来新的机遇和挑战。
伴随着智能手机的普及,越来越多的图像是由手机拍摄得到,而这部分图像对了解用户行为、获取用户相关信息有极大价值。这些图像拍摄的场景各式各样,可能是日常的路边,也有可能是旅途中。由于文字表达的信息相对准确,通过检测和识别场景中的文字,对图像和视频信息的提取具有重要意义。对于视频监控和基于位置的服务(LBS)等应用,通过识别图像中的文字,如招牌、标识等内容,对定位图像拍摄地点有重要的参考作用;通过检测和识别场景中的文字,还可实现实时的翻译服务。
自然场景的文字检测和识别作为图像理解的重要一环,一直受到研究者的关注。一般来说,对于扫描文本,可以直接通过光学字符识别(OCR)软件进行识别,对于稍复杂的样本,可能包含有各类不同字体和大小的文字,以及各类格式的混排,如竖排文字,对于该类样本需要先进行适度的分割,再输入到光学字符识别软件中。但光学字符识别系统只能处理背景简单且文本相对密集的图像,对于包含复杂背景的自然图像,必须先通过文字定位取出包含文本的图像块,才能实现准确的识别。对于文字背景较为复杂的图像,还必须经过文字背景分离才能得到理想的识别结果。在目前大部分的解决方案中,文字检测和识别作为孤立的两部分的工作分别进行处理。
霍夫变换是用于检测具有解析表达式的几何形状的常用目标检测方法,如直线、圆检测等。霍夫变换的核心思想是把原图像中的像素点或特征变换到霍夫空间进行投票,而投票的峰值即为检测的目标。广义霍夫变换在霍夫变换的基础上进行扩展,可对一般形状的目标进行检测。广义霍夫变换的基本思想是通过图像中每一个分块的边缘切向量估算目标的中心点位置,本质上利用边缘切向量,为不存在解析表达的形状建立参数空间,从而应用霍夫变换。广义霍夫变换假设的前提是,图像中每个像素都是独立的,在投票过程中对每一个分块赋予相同的权重,使得该方法在复杂场景下容易失效。Gall等人基于霍夫变换的思想,在2009年提出通过霍夫森林实现鲁棒的行人等目标的检测方案。霍夫森林对图像中每一个分块通过一组决策树进行分类(前景和背景),并估算目标的中心位置,使用决策树输出的概率作为投票权重。
发明内容
本发明为了解决现有技术中的问题,提出一种基于组件树和霍夫森林的文字检测和识别方法。通过组件树级联分类器的方式提取文字候选区域以确定目标尺度,解决了霍夫森林在检测中尺度不准确以及定位漂移的问题。
本发明采用以下技术方案:一种基于组件树和霍夫森林的文字检测和识别方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510107607.4/2.html,转载请声明来源钻瓜专利网。