[发明专利]一种带有文本方向校正的英文文本检测方法有效
申请号: | 201810429149.X | 申请日: | 2018-05-08 |
公开(公告)号: | CN108647681B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 代劲;王族;尹航 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本区域 方向校正 文本 候选文本 文本检测 分类器 卷积神经网络 图像处理技术 英文文本图像 非文本区域 分组 英文 场景文本 多层空间 分组算法 极值区域 多尺度 多通道 提取池 源图像 校正 并行 过滤 精细 图像 检测 引入 | ||
1.一种带有文本方向校正的英文文本检测方法,其特征在于,包括以下步骤:
S1、分别对英文文本图像的锐化图像各个通道进行最大稳定极值区域检测,从图像中提取最大稳定极值区域;得出候选文本区域;
S2、建立基于卷积神经网络模型的分类器,提取出候选文本区域的特征;利用softmax函数根据候选文本区域的特征,将候选文本区域分为文本类区域和非文本类区域;过滤非文本类区域,获得初步文本区域,即检测出英文文本;
S3、利用双层文本分组算法将所述初步文本区域分组;
S4、将分组后的初步文本区域进行方向校正,从而实现英文文本的校正;
S401、使用坐标旋转公式分别将分组后的初步文本区域以顺时针旋转α度;设定初始值i=1,α=-30°;
S402、通过模型匹配过程,将错误引入的分组框过滤;获得第i个待定校正文本区域;
S403、当i<6时,i=i+1,α=α+10°;返回步骤S401,当i=6时,将第1个待定校正文本至第6个待定校正文本叠加,从而获得最终校正文本。
2.根据权利要求1所述的一种带有文本方向校正的英文文本检测方法,其特征在于,所述通道包括:红色通道、绿色通道、蓝色通道、色调通道、饱和度通道、明度通道以及灰通道。
3.根据权利要求1所述的一种带有文本方向校正的英文文本检测方法,其特征在于,所述建立基于卷积神经网络模型的分类器,提取出候选文本区域的特征包括:分别根据分类器中的五层架构获得候选文本区域的第一特征以及通过跨层获得候选文本区域的第二特征,其中,五层架构包括依次相连的第一卷积层,最大池化层、第二卷积层、金字塔池化层以及全连接层;跨层表示第一卷积层到全连接层。
4.根据权利要求3所述的一种带有文本方向校正的英文文本检测方法,其特征在于,所述第一特征的获取方式为:利用第一层架构中的第一卷积核对候选文本区域进行第一次滤波;将第一次滤波后的候选文本区域在第二层架构中进行最大池化;利用第三层架构中的第二卷积核,对最大池化后的候选文本区域进行第二次滤波;对第二次滤波后的候选文本区域,在第四层架构中进行利用金字塔池化;对金字塔池化后的候选文本区域在第五层架构中进行全连接,从而提取出候选文本区域的第一特征。
5.根据权利要求3所述的一种带有文本方向校正的英文文本检测方法,其特征在于,所述第二特征的获取方式为:利用手动添加的特征,将第一卷积核对候选文本区域进行第一次滤波;将滤波后的候选文本区域按照手动添加的特征进行全连接,从而提取出候选文本区域的第二特征。
6.根据权利要求5所述的一种带有文本方向校正的英文文本检测方法,其特征在于,所述手动添加的特征包括:高宽比、紧密性、笔画宽度面积比、局部对比度和边界关键点。
7.根据权利要求1所述的一种带有文本方向校正的英文文本检测方法,其特征在于,所述利用双层文本分组算法将所述初步文本区域分组包括:将初步文本区域进行垂直分组,具体包括:
获取第n个初步文本区域中像素为255的最小Y轴坐标bn;获取第n+1个初步文本区域中像素为255的最大Y轴坐标tn+1;获取第n+1个初步文本区域的高度hn+1;
计算高度差如果高度差dn,n+1大于高度阈值;则将两个初步文本区域划分为相同的类,即属于同一文本行;如果高度差dn,n+1小于或等于高度阈值,则两个初步文本区域不是相同的类,第n+1个初步文本区域被视为新文本行,且将所述新文本行在Y轴方向拆分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810429149.X/1.html,转载请声明来源钻瓜专利网。