[发明专利]一种融合空洞卷积的快速场景文本检测方法在审
申请号: | 202210046573.2 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114529894A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 谭钦红;江一峰;黄俊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06N3/04;G06K9/62;G06V10/82;G06V10/774;G06V10/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 空洞 卷积 快速 场景 文本 检测 方法 | ||
本发明公开了一种融合空洞卷积的快速场景文本检测方法,包括获取文本检测训练数据集,并对训练数据集进行标签生成;建立融合空洞卷积的快速场景文本检测初步模型;所述融合空洞卷积的快速场景文本检测初步模型包括轻量级特征提取模块、空洞卷积模块和可微分二值化模块;使用标签生成的训练数据集对建立的融合空洞卷积的快速场景文本检测初步模型,并使用损失函数计算损失值以调整所述初步模型的参数得到融合空洞卷积的快速场景文本检测模型;采用融合空洞卷积的快速场景文本检测模型对场景中文本进行检测。本发明利用轻量级的神经网络替换大型网络用于提取输入图形的特征,降低的网络模型参数量,可以有效的提高文本检测网络模型的效率。同时为了弥补轻量级神经网络提取特征不足的问题,在特征融合层增加空洞卷积模块并使用通道注意力机制对特征进行融合筛选,提高了网络中特征的利用效率。因此本发明在保持较高文本检测水平的情况下,实现场景文本的快速检测。
技术领域
本发明涉及图像处理领域,具体涉及一种融合空洞卷积的快速场景文本检测方法。
背景技术
随着经济社会的高速发展以及智能终端的快速普及,人们获取信息的渠道越来越多样化,图像和视频成为信息传播的主要媒介。不同于一般图像中的视觉元素,图像中出现的文本作为图像中的一个重要内容,往往对视觉信息的表达起着至关重要的作用。如果能检测并识别图像中出现的文本信息,无疑能极大的帮助人们分析和理解这些场景图像中所蕴含的更深层次的信息,进而推动诸如图像搜索、自动驾驶以及办公自动化等技术的发展和应用,为人们的生产和生活提供极大的便利。
自然场景中的文本自身具有背景复杂、文本尺度差异大、文本形状多样化以及文本边缘不明显等诸多不利于检测的特点,通过机器对自然场景图像中的文本进行精确的检测仍然是一项非常具有挑战的任务。
传统的场景文本检测方法依赖人工设计的特征,通过LBP、DPM、HOG等方法对输入图像进行传统特征提取,然后使用特定的分类器或者启发式规则对提取出的特征进行分类。比较典型的两类场景文本检测分别是基于连通域的方法和基于滑动检测检测窗的方法。由于这些方法过度的依赖人工设计的特征,无法有效的应对光照强度、图像质量以及文本背景等客观因素的变化,该类文本检测方法鲁棒性较差。
近年来,深度学习如深度卷积神经网络在计算机视觉领域的成功应用促进了自然场景文本检测的研究与发展,这一方法通常利用特定的数据集训练以深度卷积神经网络为基础的网络模型用于自动提取输入图像的基本特征,然后再通过一系列后处理算法得到最终的文本区域。与传统的场景文本检测算法相比,该方法有效的避免了人工设计特征的局限性。目前基于深度学习的场景文本检测算法一般采用大型深度神经网络作为主干网络进行特征提取,文本检测准确率显著但是由于检测模型十分庞大,不利于文本检测算法的移植。在实际应用中,自然场景下的文本检测除了追求文本检测准确率的同时,还需要考虑文本检测的效率,过于庞大的场景文本检测模型势必会出现检测缓慢的问题,从而影响这一场景文本检测算法在实际生活中的应用。
发明内容
当前基于深度学习的场景文本检测方法通常采用大型深度神经网络作为骨干网络进行特征提取,庞大的文本检测模型会导致检测速度过于缓慢,从而影响了场景文本检测算法的实际应用。针对这一问题,本发明提供了一种融合空洞卷积的快速场景文本检测方法,具体包括以下步骤:
S1、获取文本检测训练数据集,并对训练数据集进行标签生成;
S2、建立融合空洞卷积的快速场景文本检测初步模型;所述融合空洞卷积的快速场景文本检测初步模型包括轻量级特征提取模块、空洞卷积模块和可微分二值化模块;
S3、使用步骤S1所述标签生成的训练数据集对步骤S2所述建立的融合空洞卷积的快速场景文本检测初步模型,并使用损失函数计算损失值以训练所述初步模型得到融合空洞卷积的快速场景文本检测模型;
S4、使用步骤S3所述得到的融合空洞卷积的快速场景文本检测模型,对场景图像中的文本进行检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210046573.2/2.html,转载请声明来源钻瓜专利网。