[发明专利]一种基于MSDNet和空间划分的场景文本检测方法在审
申请号: | 202010715197.2 | 申请日: | 2020-07-23 |
公开(公告)号: | CN111950545A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 杨育彬;刘一帆 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62;G06N3/08 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 msdnet 空间 划分 场景 文本 检测 方法 | ||
本发明提供了一种基于MSDNet和空间划分的场景文本检测方法,包括选取MSDNet网络模型,确定初始预训练模型;搭建空间划分网络;搭建回归网络;构造分类loss;空间划分集成;使用concat‑nms算法第一步后处理;使用box‑fix算法第二步后处理;使用tensorflow深度学习框架对已有的数据进行训练;使用已训练好的模型进行场景文本检测。本发明提供的方法可以自由地根据硬件条件和速度要求来选择不同的模型输出端口,通过提出的concat‑nms和box‑fix算法,来生成任意长的和更精确的文本框,在场景文本检测方面取得了令人满意的实验结果。因此,相较于现有技术,本方法灵活性好、分类精度较高、模型训练简单且实用性高。
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于MSDNet和空间划分的场景文本检测方法。
背景技术
在计算机视觉领域,文本检测,即从图片中准确检测出文字区域是一个重要问题,它为理解图片提供了前提条件。
自深度学习以来,CTPN,EAST等算法通过使用神经网络模型,使文本检测取得了突破性进展。现阶段,文本检测算法主要分为一阶段算法和二阶段算法。其中,一阶段算法主要以CTPN(Detecting Text in Natural Image with Connectionist Text ProposalNetwork)和EAST(An Efficient and Accurate Scene Text Detector)算法为代表。二阶段算法主要是基于Mask-Rcnn进行语义分割。由于二阶段算法需要设置很多anchor并进行roi池化,检测速度比较慢。
现有的场景文本检测方法存在很多不足之处。具体的,第一,现有的场景文本检测方法并没有提供一个根据硬件条件和用户需求自动修改模型复杂度的模型框架;第二,现有的场景文本检测模型中,由于正负样本不均衡给模型的训练带来了困难;第三,现有的场景文本检测方法中所采用的基于回归的一阶段算法难以检测任意长的文本。
发明内容
本发明提供了一种基于MSDNet和空间划分的场景文本检测方法,以解决现有的文本检测方法的检测模型复杂度无法调整、检测模型训练困难且难以实现任意长文本检测,而导致现有的文本检测方法灵活性差、模型训练困难且实用性低这一问题。
本发明所述的一种基于MSDNet网络和空间划分的场景文本检测方法,包括如下步骤:
步骤1,构建特征金字塔,确定初始预训练的多尺度密集网络MSDNet的网络模型,用于提供backbone网络;其中,MSDNet的中文全称为多尺度密集网络,英文全称为Multiscale Dense Network。
步骤2:在所述backbone网络的基础上,构建空间划分网络,即构建多个线性分类器,用于对图像中的文本区域进行检测并输出文本区域划分结果;
步骤3:在所述backbone网络的基础上,构建边框回归网络,用于输出边框回归结果;
步骤4:确定所述空间划分网络的学习任务,即所述空间划分网络中每个线性分类器应学习的点和使用的分类loss;
步骤5:结合所述空间划分网络的学习任务和文本区域划分结果,对所述文本区域划分结果进行空间划分集成,获得空间划分集成结果;
步骤6:通过concat-nms算法,根据所述边框回归结果和空间划分集成结果进行第一步后处理,获得第一步后处理结果;
步骤7:通过box-fix算法,根据所述第一步后处理结果进行第二步后处理,获得第二步后处理结果;
步骤8:使用tensorflow深度学习框架构建结合MSDNet和空间划分的检测模型,并对已有的数据进行训练,获得已训练好的检测模型;
步骤9:使用所述已训练好的检测模型进行场景文本检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010715197.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:临轨深基坑混凝土支撑板底闷拆方法
- 下一篇:一种外滑车顶天窗机械组