[发明专利]一种基于深度学习的配电柜表盘数码管视觉识别方法有效
申请号: | 202110444655.8 | 申请日: | 2021-04-24 |
公开(公告)号: | CN113139541B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 吕红强;李林;郑辑光;陈亮;周攀;王希仁 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/148;G06V30/19;G06V10/82;G06V10/94;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 配电柜 表盘 数码管 视觉 识别 方法 | ||
1.一种基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,包括如下步骤:
步骤1:现场相机采集配电柜表盘图像,并通过无线传输设备发送至远程控制平台;
步骤2:在远程控制平台,通过数字区域定位和字符分割,将字符图像归一化得到标准像素尺寸后标记,生成样本数据集;
步骤3:构建基于深度学习的ResNet网络模型,将样本数据集按比例划分后输入网络模型中训练,训练后选取得分最高的模型作为待部署模型;
步骤4:将训练好的模型部署在远程控制平台,采集待测配电柜表盘图像进行预测。
2.根据权利要求1所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,所述的配电柜为电力设备标准配电柜,表盘为配电柜上若干个显示相关电力值的数字表盘,所述无线传输设备为采用数字微波传输的标准无线传输设备,所述现场相机基于远程控制平台,采用C++接口逐个读取各个现场的配电柜表盘图像。
3.根据权利要求1所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,所述步骤2中,对配电柜表盘图像采用R通道灰度化处理,通过高斯滤波并进行平滑处理,消除噪声,然后进行数字区域定位。
4.根据权利要求1或3所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,所述数字区域定位的方法是:标注感兴趣区域,将标注点引向四周,提取四个角的像素点特征,提取感兴趣区域,即图像中的数字区域,同时进行角度矫正;所述字符分割的方法是:在数字区域中,根据水平垂直投影切割最小字符区域,然后依据先验信息数字高宽比和行列数,等分切割出单字符;所述将字符图像归一化得到标准像素尺寸后标记的方法是:将分割好的数字字符按照20*50像素标准化,分别将数字1至9标记为文件夹1至9,将带有小数点的“1.”至“9.”字符标记为文件夹10至19,一共20类样本数据集。
5.根据权利要求4所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,切割出单字符之后,将提取的数码管字符的二值化图像在竖直方向投影,投影公式为:
其中,Sj为第j列的图像像素值为255的像素点的和,i、j分别为图像像素点的行列坐标,cols是图像的列宽,P(i,j)取值0或者1,当坐标(i,j)点的像素点的灰度值为255时,P(i,j)取值为1,否则为0;以图像的行号作为横轴,以对应每行的灰度值为255的像素点数目作为纵轴生成投影直方图,扫描投影直方图,提取最大最小的边界坐标点,从而得到数码管字符的上下边界,进而达到字符分割的目的。
6.根据权利要求1所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,所述步骤3中,配置Linux+GPU服务器环境,创建基于Keras框架的深度学习沙盒环境,安装包括keras-2.0.8、tensorflow-gpu-1.10.0、opencv-python-4.4.0在内的需求package,采用CNN特征提取、残差学习的ResNet网络学习方式,基于GitHub的代码框架完成深度学习ResNet网络环境的配置和模型的搭建。
7.根据权利要求1或6所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,将样本数据集按训练集:验证集:测试集为8:1:1的比例划分,并采用Keras中的ImageDataGenerator方法对训练集和验证集进行数据扩增,之后将扩增后的数据作为网络模型训练的输入,训练过程中采用网格化测试方法对模型网络参数进行训练,在测试集中选取得分最高的网络模型作为最终训练成功的待部署模型。
8.根据权利要求1所述基于深度学习的配电柜表盘数码管视觉识别方法,其特征在于,所述步骤4中,采用C++中的frugally-deep读取keras框架下训练好的待部署模型,首先将python工程下的“.h5”模型文件转为C++工程下的“.json”模型,然后依赖于三个头文件库FunctionalPlus,Eigen和json,完成C++下深度学习模型的部署。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110444655.8/1.html,转载请声明来源钻瓜专利网。