[发明专利]一种数字水表的数据识别方法有效
申请号: | 201811578928.2 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109614974B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 覃鹏志;包勇;文耀锋 | 申请(专利权)人: | 浙江大学常州工业技术研究院 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19 |
代理公司: | 常州市权航专利代理有限公司 32280 | 代理人: | 朱鑫乐 |
地址: | 213000 江苏省常州市新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字 水表 数据 识别 方法 | ||
1.一种数字水表的数据识别方法,其特征在于,包括以下步骤:
S1、对摄像机拍摄的原始灰度图进行预处理得到中间灰度图作为第一训练样本,收集n张中间灰度图组成第一训练集;
S2、标记所述中间灰度图中的实际多位数区域的四个顶点坐标分别为
、、和,其中i=1,2,3…n;
S3、构建分割神经网络,所述分割神经网络的激活函数为Leaky ReLU,损失函数为:
,
,
所述为分割神经网络的预测向量,所述为真实向量;
、、和为预测多位数区域的四个顶点的坐标;
为实际多位数区域内并且在预测多位数区域外的点对应的值;
为实际多位数区域外并且在预测多位数区域内的点对应的值;
为实际多位数区域内并且在预测多位数区域内的点对应的值;
S4、将第一训练样本输入分割神经网络进行训练,根据Loss反向传播,更新分割神经网络的权值,得到训练好的分割神经网络;
S5、将中间灰度图中的实际多位数区域切割出来并且通过透视变换成实际矩形图,将实际矩形图中每个数字切割出来的数字灰度图作为第二训练样本,收集m个第二训练样本组成第二训练集;
S6、构建识别神经网络,所述识别神经网络为卷积神经网络,激活函数为ReLU,损失函数为交叉熵Loss’;
S7、将所述第二训练样本输入识别神经网络进行训练,根据Loss’反向传播,更新识别神经网络的权值,得到训练好的识别神经网络;
S8、将待识别的原始灰度图进行预处理得到中间灰度图,将中间灰度图输入分割神经网络中,输出,得到预测多位数区域的四个顶点的坐标为、、和,将预测多位数区域从中间灰度图中切割出来,接着通过透视变换成矩形图,将矩形图中每个数字切割出来得到数字灰度图并依次输入识别神经网络中,得到每个数字的预测值并重新组合为多位数。
2.如权利要求1所述的一种数字水表的数据识别方法,其特征在于:
所述步骤S4包括以下步骤:
S401、中间灰度图通过64个3*3*1的卷积核进行卷积,步数为1,再利用64个3*3*64的卷积核进行两次卷积得到中间特征图;
S402、对中间特征图进行批量标准化处理后通过所述Leaky ReLU对其进行非线性映射;
S403、中间特征图经过2*2的最大池化,步数为2;
S404、中间特征图通过128个3*3*64的卷积核进行卷积,步数为1,再利用128个3*3*128的卷积核进行两次卷积,重复步骤S402~S403;
S405、中间特征图通过256个3*3*128的卷积核进行卷积,步数为1,再利用256个3*3*256的卷积核进行两次卷积,重复步骤S402~S403;
S406、中间特征图通过512个3*3*256的卷积核进行卷积,步数为1,再利用512个3*3*512的卷积核进行两次卷积,重复步骤S402~S403;
S407、中间特征图通过512个3*3*512的卷积核进行三次卷积,步数为1,重复步骤S402~S403;
S408、将中间特征图转换为4048维的特征向量V1;
S409、对特征向量V1进行dropout处理;
S410、将特征向量V1转换成1000维的特征向量V2;
S411、对特征向量V2进行dropout处理;
S412、利用Softmax函数处理特征向量V2,得到;
S413、计算并根据Loss反向传播,更新分割神经网络的权值,得到训练好的分割神经网络。
3.如权利要求2所述的一种数字水表的数据识别方法,其特征在于:所述识别神经网络包括第二输入层、第二卷积层、第二池化层、第三卷积层、第三池化层、第三全连接层、第四全连接层和第二输出层;
所述步骤S7包括以下步骤:
S701、在第二卷积层中,维度为56*56*1的数字灰度图通过32个5*5*1的卷积核进行卷积,步数为1,补零之后得到56*56*32的三维特征图,然后函数ReLU对此三维特征图进行非线性映射;
S702、在第二池化层中,56*56*32的三维特征图经过2*2的最大池化,步数为2,得到28*28*32的三维特征图;
S703、在第三卷积层中,维度为28*28*32的三维特征图通过64个5*5*32的卷积核进行卷积,步数为1,补零之后得到28*28*64的三维特征图,然后函数ReLU对此三维特征图进行非线性映射;
S704、在第三池化层中,28*28*64的三维特征图经过2*2的最大池化,步数为2,得到14*14*64的三维特征图;
S705、在第三全连接层中,将14*14*64的三维特征图转换为1024维的特征向量V3;
S706、在第四全连接层中,将1024维的特征向量V3转换为10维的特征向量V4;
S707、在第二输出层,利用Softmax函数归一化所述特征向量V4,得到特征向量S;
S708、将特征向量S作为预测值与真实值Y输入交叉熵中计算Loss’,根据Loss’反向传播,更新识别神经网络的权值,得到训练好的识别神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学常州工业技术研究院,未经浙江大学常州工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811578928.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置