[发明专利]一种基于多层次文本组件定位与生长的文本区域提取方法有效
申请号: | 201811267160.7 | 申请日: | 2018-10-29 |
公开(公告)号: | CN109460763B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 苏丰;丁文俊;汪洋;王雨阳;王岚 | 申请(专利权)人: | 南京大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V30/148 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 王斌 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多层次文本组件定位与生长的自然场景图像中文本区域提取方法,首先输入灰度或彩色RGB图像;在输入图像上运行MSER算法,进而以MSER边界作为区域边缘在MSER中运行SWT算法,获取极值区域内部像素的笔画宽度值;在极值区域中计算笔画宽度直方图,选取直方图中包含最多像素数量的三个笔画宽度对应的像素集合,并将通过边缘梯度差角特征验证的像素集合中的像素作为种子像素;基于种子像素,迭代进行字符内、字符间两个层次的生长过程,进一步基于多种文本区域特征对生长后获得的区域进行过滤,并将最终得到的文本区域作为结果输出。本发明提出的文本区域提取方法能够兼顾提取结果的精度和召回率,同时不依赖于特定机器学习模型,简单易重现。 | ||
搜索关键词: | 一种 基于 多层次 文本 组件 定位 生长 区域 提取 方法 | ||
【主权项】:
1.一种基于多层次文本组件定位与生长的自然场景图像中文本区域提取方法,其特征在于包括以下步骤:步骤一:输入包含文本对象的灰度或彩色自然场景图像;步骤二:提取输入图像中的文本种子像素;步骤三:基于提取的文本种子像素,迭代进行字符内生长过程,具体做法是:计算与文本种子像素邻接的像素的灰度值、颜色值和笔画宽度值与文本种子像素相应值的差值,将差值小于特定阈值的邻接像素作为生长得到的新文本种子像素,并迭代本生长过程直至抵达区域边缘或无法进一步生长邻接像素,得到文本像素连通区域;步骤四:基于步骤三得到的文本像素连通区域,迭代进行字符间生长过程,具体做法是:选择两个中心距离小于特定阈值的文本像素连通区域,在其各自最小包围矩形的垂直方向边的对应四等分点的连线上,寻找灰度值、颜色值和笔画宽度值与两个文本像素连通区域相应参数均值的差值小于特定阈值且数量足够多的连通像素,将其作为生长得到的新文本像素连通区域的文本种子像素集合;步骤五:基于步骤四得到的新的文本种子像素,重复进行步骤三和步骤四的迭代生长过程,直至无法获得新的文本像素连通区域;步骤六:对最终得到的文本像素连通区域进行过滤以去除其中可能包含的非文本区域,将过滤后的文本区域作为最终提取结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811267160.7/,转载请声明来源钻瓜专利网。