[发明专利]基于分割候选区提取的多方向文本检测算法在审
申请号: | 201811406382.2 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109753956A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 袁媛;王琦;杨馥魁 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种新的基于分割的多方向文本检测框架,主要解决了现有的算法对多方向的文本定位不够精准的问题。该方法首先采用全卷积网络对输入图片进行分割,然后将分割获取的连通区域的外接矩形框作为候选区域。由于获取的外接矩形框带有一定的旋转角度,无法直接通过ROIpooling层进行特征提取。因此一种新的旋转的ROIpooling层被引入到网络结构中进行特征的提取。最后经过两层全连接层对候选区域进行分类和回归。 | ||
搜索关键词: | 多方向 外接矩形框 候选区域 文本检测 算法 分割 分类和回归 分割候选 连通区域 输入图片 特征提取 网络结构 连接层 卷积 两层 文本 引入 网络 | ||
【主权项】:
1.一种基于分割候选区提取的多方向文本检测算法,其特征在于步骤如下:步骤1:对训练数据集进行随机截取采样,将groundtruth矩形框包含的区域向内缩放一半;步骤2:利用步骤1中生成的训练数据训练层级的全卷积网络,得到分割模型;步骤3:利用步骤2中训练的分割模型对输入图片进行分割,通过连通域分析的方法,获取连通域的外接矩形框作为候选区域;步骤4:通过分析连通区域的主轴方向,获取旋转角度;将获取的候选区域映射到原图四分之一大小的特征图上;步骤5:根据步骤4中获取的旋转角度,构建旋转矩阵,引入到ROIpooling层中,得到可处理多方向候选区域的旋转ROIpooling层;利用旋转ROIpooling层获取候选区域的特征向量;旋转后的特征图宽高可由下式求得:Hr=W*sinβ+H*cosβ (13)Wr=W*cosβ+H*sinβ (14)W、H为旋转前的宽和高,β为旋转角度;旋转变换矩阵如下式所示:
其中,![]()
步骤6:将特征向量输入到两层全连接层中,进行回归和分类,实现对多方向文本的检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811406382.2/,转载请声明来源钻瓜专利网。