[发明专利]一种带有文本方向校正的英文文本检测方法有效

申请号：	201810429149.X	申请日：	2018-05-08
公开（公告）号：	CN108647681B	公开（公告）日：	2019-06-14
发明（设计）人：	代劲;王族;尹航	申请（专利权）人：	重庆邮电大学
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/62
代理公司：	重庆辉腾律师事务所 50215	代理人：	王海军
地址：	400065 重***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本区域方向校正文本候选文本文本检测分类器卷积神经网络图像处理技术英文文本图像非文本区域分组英文场景文本多层空间分组算法极值区域多尺度多通道提取池源图像校正并行过滤精细图像检测引入
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种带有文本方向校正的英文文本检测方法，其特征在于，包括以下步骤：

S1、分别对英文文本图像的锐化图像各个通道进行最大稳定极值区域检测，从图像中提取最大稳定极值区域；得出候选文本区域；

S2、建立基于卷积神经网络模型的分类器，提取出候选文本区域的特征；利用softmax函数根据候选文本区域的特征，将候选文本区域分为文本类区域和非文本类区域；过滤非文本类区域，获得初步文本区域，即检测出英文文本；

S3、利用双层文本分组算法将所述初步文本区域分组；

S4、将分组后的初步文本区域进行方向校正，从而实现英文文本的校正；

S401、使用坐标旋转公式分别将分组后的初步文本区域以顺时针旋转α度；设定初始值i＝1，α＝-30°；

S402、通过模型匹配过程，将错误引入的分组框过滤；获得第i个待定校正文本区域；

S403、当i<6时，i＝i+1，α＝α+10°；返回步骤S401，当i＝6时，将第1个待定校正文本至第6个待定校正文本叠加，从而获得最终校正文本。

2.根据权利要求1所述的一种带有文本方向校正的英文文本检测方法，其特征在于，所述通道包括：红色通道、绿色通道、蓝色通道、色调通道、饱和度通道、明度通道以及灰通道。

3.根据权利要求1所述的一种带有文本方向校正的英文文本检测方法，其特征在于，所述建立基于卷积神经网络模型的分类器，提取出候选文本区域的特征包括：分别根据分类器中的五层架构获得候选文本区域的第一特征以及通过跨层获得候选文本区域的第二特征，其中，五层架构包括依次相连的第一卷积层，最大池化层、第二卷积层、金字塔池化层以及全连接层；跨层表示第一卷积层到全连接层。

4.根据权利要求3所述的一种带有文本方向校正的英文文本检测方法，其特征在于，所述第一特征的获取方式为：利用第一层架构中的第一卷积核对候选文本区域进行第一次滤波；将第一次滤波后的候选文本区域在第二层架构中进行最大池化；利用第三层架构中的第二卷积核，对最大池化后的候选文本区域进行第二次滤波；对第二次滤波后的候选文本区域，在第四层架构中进行利用金字塔池化；对金字塔池化后的候选文本区域在第五层架构中进行全连接，从而提取出候选文本区域的第一特征。

5.根据权利要求3所述的一种带有文本方向校正的英文文本检测方法，其特征在于，所述第二特征的获取方式为：利用手动添加的特征，将第一卷积核对候选文本区域进行第一次滤波；将滤波后的候选文本区域按照手动添加的特征进行全连接，从而提取出候选文本区域的第二特征。

6.根据权利要求5所述的一种带有文本方向校正的英文文本检测方法，其特征在于，所述手动添加的特征包括：高宽比、紧密性、笔画宽度面积比、局部对比度和边界关键点。

7.根据权利要求1所述的一种带有文本方向校正的英文文本检测方法，其特征在于，所述利用双层文本分组算法将所述初步文本区域分组包括：将初步文本区域进行垂直分组，具体包括：

获取第n个初步文本区域中像素为255的最小Y轴坐标b_n；获取第n+1个初步文本区域中像素为255的最大Y轴坐标t_n+1；获取第n+1个初步文本区域的高度h_n+1；

计算高度差如果高度差d_n,n+1大于高度阈值；则将两个初步文本区域划分为相同的类，即属于同一文本行；如果高度差d_n,n+1小于或等于高度阈值，则两个初步文本区域不是相同的类，第n+1个初步文本区域被视为新文本行，且将所述新文本行在Y轴方向拆分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆邮电大学，未经重庆邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810429149.X/1.html，转载请声明来源钻瓜专利网。

上一篇：图像定位框检测方法和装置
下一篇：一种基于区域卷积神经网络模型的品牌Logo检测与识别方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种带有文本方向校正的英文文本检测方法有效

专利文献下载