[发明专利]一种基于深度学习的互感器铭牌文本区域检测方法在审
申请号: | 202110748403.4 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113378838A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 于秀丽;董明帅;魏世民;吴澍;白宇轩;杨奉豪 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 互感器 铭牌 文本 区域 检测 方法 | ||
1.一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,所述方法包括:
互感器铭牌图像数据集的收集、标定及预处理;
公共场景数据集(ICDAR2015,ICDAR2017)的预处理;
搭建多维度特征提取及特征融合的主干网络;
搭建基于多维度特征的互感器文本区域检测网络,我们将其命名为DBU;
使用公共场景数据集对DBU网络进行预训练;
使用互感器铭牌数据集训练DBU网络;
使用互感器铭牌图像测试数据集测试DBU网络的性能。
2.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,互感器铭牌图像数据集的收集、标定及预处理,生成互感铭牌图像的训练数据,具体包括:
所述互感器铭牌图像数据集为根据互感器铭牌文本识别需求拍摄制作的数据集,并且根据铭牌文本的语义对图像中包含的文本分区域标定。同时,根据文本检测模型输入图像的尺寸需求对采集到的图像做裁剪。
3.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,公共场景数据集(ICDAR2015,ICDAR2017)的预处理,生成初始数据,具体包括:
所述公共场景数据集(ICDAR2015,ICDAR2017)的预处理,以及按照比例生成训练和测试数据。
4.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,搭建多维度特征提取及特征融合的主干网络,具体包括:
所述搭建多维度特征提取及特征融合网络为利用多层卷积神经网络进行下采样操作,生成多组不同感受野维度的特征图,并通过多次上采样及特征连接操作将不同维度的进行特征图融合。
5.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,搭建基于多维度特征的互感器文本区域检测网络,具体包括:
所述多维度特征为多维度特征提取及融合网络生成的特征图。所述互感器文本区域检测网络利用多维度特征进行互感器文本区域的检测。
6.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,使用公共场景数据集对DBU网络进行预训练,具体包括:
所述使用公共场景数据集对DBU网络进行预训练,为使用数量规模大的公共数据集预训练DBU网络,该训练过程的主要目的是训练DBU网络的特征提取能力。
7.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,使用互感器铭牌数据集训练DBU网络的DB部分,具体包括:
所述使用互感器铭牌数据集训练DBU网络中DB文本区域检测部分。通过互感器铭牌数据集训练模型的文本检测部分,提高文本检测部分对互感器铭牌特征的敏感性。
8.根据权利要求1所述的一种基于深度学习的互感器铭牌文本区域检测方法,其特征在于,使用互感器铭牌图像测试数据集测试DBU网络性能,还包括:
所述使用互感器铭牌图像测试数据集测试DBU网络的性能。
所述互感器铭牌图像数据集为根据文本识别网络的应用场景采集、制作、标注的数据集;所述公共场景数据集为已经公开的图像中包含铭牌相关信息的数据集;所述搭建基于多维度特征的互感器文本区域检测网络,包含文本检测网络与多维度特征提取与融合网络的级联。所述使用公共场景数据集对DBU网络进行预训练,包括网络模型的训练及网络参数调整;所述使用互感器铭牌图像测试数据集测试DBU网络的性能,包括采用真实的互感器铭牌图像测试DBU网络的文本区域检测性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110748403.4/1.html,转载请声明来源钻瓜专利网。