[发明专利]一种基于深度学习的互感器铭牌文本区域检测方法在审
申请号: | 202110748403.4 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113378838A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 于秀丽;董明帅;魏世民;吴澍;白宇轩;杨奉豪 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 互感器 铭牌 文本 区域 检测 方法 | ||
本发明公开了一种基于深度学习的互感器铭牌文本区域检测方法。该方法利用一阶段模型使用图像像素分类的原理检测互感器设备铭牌上的文本区域。其中互感器铭牌图像特征提取及融合方法采用U‑Net网络多维度特征融合的方法,通过该方法能够准确的提取图像中不同尺寸文字区域的特征。同时,为了提高互感器铭牌图像中长文本的识别性能,在文本检测阶段采用Differentiable Binarization(DB)网络对融合后的特征进行关联、映射及分类,从而避免存在语义关联的长文本在文本检测时被截断的情况。因此,通过U‑Net网络和DB网络相结合的方式既提高了模型对小区域本文的检测能力,也增强了模型对长文本的特征学习能力,从而提高了整个文本检测模型的精度。
技术领域
本发明涉及深度学习以及图像识别领域,是一种基于深度学习的互感器铭牌文本区域检测方法。
背景技术
互感器是当前电力系统的重要组成部分。随着我国电力系统的不断发展,对于各类互感器的需求也不断增加。因此,为了更科学的管理互感器设备,需要对互感器各种型号及规格做合理的统计。当前互感器各类信息的识别和统计都是通过人工完成的,这种方式效率低下、成本高并且容易出错。因此,互感器设备铭牌信息的自动识别及统计是一个重要的研究方向。在这个过程中首先要解决的是互感器铭牌本文区域的检测,这是互感器铭牌文本识别的基础。
由于互感器工作环境恶劣,铭牌信息与互感器本体对比不明显,并且,铭牌数据中存在字体大小不同、中英文及特殊符号混杂的情况。因此,如何提供一种准确的互感器文本区域检测方案,是当前亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于深度学习的互感器铭牌文本区域检测方法,该方法借鉴U-Net网络的结构,采用ResNet50网络作为主干网络提取互感器铭牌图像的特征,并通过上采样及特征融合方法融合多维度特征。最后,通过像素分类的方法区分不同语义的文本块及背景。通过这种方法实现不同语义的文本块的检测。
对于真实场景中互感器铭牌文本区域的检测,本发明提供了一种高精度互感器铭牌文本检测方法,该方法不但能够准确的检测出文本区域,而且可以根据像素的特征及语义信息划分成不同的文本块。为后续不同语义内容的文本识别、整理及归档做了充分的铺垫。
一方面,本申请实施例提供的一种基于深度学习的互感器铭牌文本区域检测方法,包括:
互感器铭牌图像数据集的收集、标定及预处理;
进一步地,所述步骤互感器铭牌图像数据集的收集、标定及预处理,具体包括互感器铭牌图像数据集的收集。本发明所使用的数据集是收集的某电网公司管辖范围内各种型号互感器的铭牌图像,共记96张。
进一步地,互感器铭牌图像数据集的标定,对采集完成的数据集进行标定。具体包括使用labelme工具标注互感器图像中不同互感器参数指标的文本框。标注完成的文件保存为json格式,用于后续的模型训练及测试。
进一步地,所述互感器铭牌图像数据集的预处理。具体包括数据集的特征工程、数据增强以及区分训练集和测试集三部分。特征工程是根据labelme工具生成的标签文件对文本区域的位置信息向量化,提高模型训练过程的计算效率。数据增强是将做完特征工程的数据按照一定变换规则做扩展,增加训练数据的数量,从而减少模型训练过程中的过拟合现象。常用的数据增强手段有旋转、裁剪、调整亮度、加入高斯噪声等;
公共场景数据集(ICDAR2015,ICDAR2017)的预处理;
进一步地,所述步骤公共场景数据集(ICDAR2015,ICDAR2017)的预处理中,公共场景场景文本识别数据集包括ICDAR2015及ICDAR2017。该数据集包含真实场景中各种标签、路牌以及店铺招牌等图像。对于该数据集的预处理操作包含图片尺寸的裁剪、图像标签的格式转换及特征工程等操作。使得上述两个公共数据集符合模型的对于图片尺寸及标签格式的需求。同时区分训练集和测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110748403.4/2.html,转载请声明来源钻瓜专利网。