[发明专利]一种基于最大稳定极值区域与笔画宽度的文本定位方法有效
申请号: | 201710299524.9 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107045634B | 公开(公告)日: | 2020-07-21 |
发明(设计)人: | 崔国龙;陈树东;黎明;熊丁丁;黄华宾;曾冬冬;顾钦;孔令讲 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/36 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 张杨 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最大 稳定 极值 区域 笔画 宽度 文本 定位 方法 | ||
1.一种基于最大稳定极值区域与笔画宽度相结合的铁路场景文本定位方法,具体包括如下步骤:
S1.采集待检图像,将数字摄像采集装置固定于车辆前视挡风玻璃上,视角平行于地面,持续采集待检图像;
S2.图像预处理:将待检图像转换成灰度图,采用局部直方图均衡化算法对灰度图像进行对比度增强;
S3.获取全图的最大稳定极值区域:通过对步骤S2获得的图像用0到255的变化阈值分别进行二值化,在阈值变化过程中,有一些区域会在一定范围的阈值变化中保持稳定,这些稳定的区域就是最大稳定极值区域;经过上述操作只能检测出暗文本区域,对原图进行反转后再检测一次MSER,检测出亮文本区域;
S4.初步形成字符候选区域:
步骤4.1:对步骤S3得到的最大稳定极值区域标记一个外接的检测框,根据检测框的大小和连通区域的占有率去除明显不是字符的区域,连通区域的占有率表示连通区域面积与该连通区域外接检测框面积的比值;
步骤4.2:去重复检测框:若两个检测框的左上角坐标接近,检测框尺寸也接近,则认为这两个区域重复,任意去除一个;
步骤4.3:去除具有包含关系的检测框:若两个区域具有包含关系,则将大面积检测框保留,到此留存的检测框内的区域为字符候选区域;
S5.获取笔画宽度图像:提取出各字符候选区域的骨架图像,对骨架图像进行距离变换得到笔画宽度图像;
S6.笔画特征过滤:利用笔画宽度和骨架端点数目来滤除非文本区域;
S7.文本行生成:铁路号牌文本只有两个方向:水平方向和垂直方向,通过并行的文本行生成策略将相邻的文本连接起来得到文本行;
步骤7.1:将整个原图像划分为若干行,按照候选区域中心点横坐标位置从左至右依次提取出属于第1,2行的候选区域;
步骤7.2:对两两相邻的候选区域从左至右依次判断是否符合水平文本行关联规则,得出所有相邻候选区的判断结果,将判断为文本行的相邻候选区进行组合输出;
步骤7.3:按照步骤7.2相同的方法输出划分图像第2、3行中的文本行;依次类推,直到遍历完整张图像,至此完成水平文本行的提取;
步骤7.4:再将整个原图像划分为若干列,按照候选区域中心点纵坐标位置从上至下依次提取出属于第1,2列的候选区域;
步骤7.5:对两两相邻的候选区域从上至下依次判断是否符合垂直文本行关联规则,得出所有相邻候选区的判断结果,将判断为文本行的相邻候选区进行组合输出;
步骤7.6:按照步骤7.5相同的方法输出划分图像第2、3列中的文本行;依次类推,直到遍历完整张图像,至此完成垂直文本行的提取;
S8.步骤S7判断完成后输出的文本行中会有重复的文本行,将重复的文本行删除,得到原始图像中文本行的最终结果;
其特征在于步骤S7中判断水平/垂直的相邻候选区域是否为文本行的方法为:
1)相邻候选区的检测框中心点横/纵坐标的距离是否小于规定阈值;
2)相邻候选区的检测框的高度/宽度的差值是否小于规定阈值;
3)相邻候选区的距离是否小于规定阈值;
4)相邻候选区中前景的笔画宽度的均值和平均灰度值的差值是否小于阈值;
满足上述所有条件则认为相邻区域为文本行。
2.如权利要求1所述的一种基于最大稳定极值区域与笔画宽度相结合的铁路场景文本定位方法,其特征在于所述步骤S5的具体方法为:
步骤5.1:获取字符候选区域的灰度图像,对灰度图像进行二值化,二值化的方法为将字符候选区域的前景像素点的位置赋值为0,背景像素点的位置赋值为255;
步骤5.2:在二值图的基础上,遍历值为0的像素点,与两侧背景像素点距离最近或相等的点即为骨架中心点,从而获取候选区域骨架图像;
步骤5.3:获取候选区域笔画宽度图像的方法:在二值图中寻找出骨架中心p到与其最近的背景像素点q的欧式距离||p-q||,将数值2||p-q||替换图像前景中射线qp经过的每个像素点的灰度值,遍历整个骨架图像,获得该候选区域的笔画宽度图像。
3.如权利要求1所述的一种基于最大稳定极值区域与笔画宽度相结合的铁路场景文本定位方法,其特征在于所述步骤S6的具体方法为:
步骤6.1:利用笔画宽度变异系数滤除非文本区域;
笔画宽度的变异系数可以用来度量笔画宽度变化的大小,其定义为笔画宽度的标准差与均值的比值:
式中的meansw是在笔画宽度图像中求得的笔画宽度的均值,N是笔画宽度图像中前景像素的个数,xi是图像中某一点像素的笔画宽度;由于一个连通区域内文本的笔画宽度都会保持稳定,varsw值越小就表示笔画宽度的变化越小,此区域是文本的概率就越高;
步骤6.2:根据骨架图像的端点数目滤除非文本区域;
骨架端点的判断方法为:遍历每一个骨架中心像素,若该像素的八邻域中只有一个连通像素点则认为它是笔画端点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710299524.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于监测构件的方法
- 下一篇:发光单元和基于三角测量的测距装置