[发明专利]一种用于水表读数的检测识别方法、系统及存储介质有效
申请号: | 202110300300.1 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112990198B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 高学;陈子威 | 申请(专利权)人: | 华南理工大学;华南理工大学珠海现代产业创新研究院 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/19;G06V10/82;G06N3/0464;G06N3/048;G06N3/084;G06N3/09;G06N3/091;G06N3/096 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 水表 读数 检测 识别 方法 系统 存储 介质 | ||
1.一种用于水表读数的检测识别方法,其特征在于,包括:
采集并标注含有水表表盘的图像;
对图像进行数据处理与数据增强;
构建教师网络与学生网络;
对教师网络和学生网络分别进行训练;
使用训练后的教师网络和数据标注信息共同指导训练学生网络;
待识别表盘图像输入学生网络进行识别;
所述使用训练后的教师网络和数据标注信息共同指导训练学生网络,具体为:
固定教师网络参数,学生网络各预测分支的输出与教师网络预测分支的输出损失与学生网络预测和标签的损失相加,共同反向传播,训练学生网络;
计算学生网络各预测分支与教师网络各预测分支的输出损失,具体为:
对于二者的中心预测分支,将该分支经过一个Sigmoid层后,计算特征图间的均方损失:
其中,L′heatmap表示教师和学生网络中心预测分支的残差,表示教师网络中心预测分支特征图,表示学生网络中心预测分支特征图;
对于二者的中心偏移,宽高,倾角预测分支,对教师网络的中心预测分支经过Sigmoid后3*3Maxpooling的结果取channel-wise的最大值作为系数,对每个中心点计算两网络各分支的L1损失之后,乘上这个系数,作为各分支的残差:
其中,L′wh,L′offset,L′angle分别表示教师和学生网络中心宽高预测分支、中心偏移分支、倾角预测分支的残差,Max(A,1)表示取张量A维度1上的最大值,并保留此维度,MaxPool(A,3)表示对张量A进行3*3Maxpooling运算。
2.根据权利要求1所述的检测识别方法,其特征在于,图像标注以旋转矩形框标注。
3.根据权利要求1所述的检测识别方法,其特征在于,对图像进行数据处理与数据增强,具体为:将数据增强后的图像减去各通道均值,除以各通道方差,再进行归一化,并转化为教师网络及学生网络所需的N*3*512*512的张量,N表示模型训练中的批大小。
4.根据权利要求1所述的检测识别方法,其特征在于,所述教师网络和学生网络均包括:
特征提取网络,对输入张量维度N*3*512*512的图像进行特征提取,输出特征维度为N*2048*16*16;
上采样层,对特征提取网络的输出进行上采样,输出特征维度N*64*128*128,并由此得到中心预测分支的输出特征维度为N*C*128*128,C表示分类类别数,中心偏移预测分支的输出特征维度为N*2*128*128,2分别代表预测的中心点在宽、高方向上的量化误差补偿,宽高预测分支输出维度为N*2*128*128,2分别代表检测框的宽,高;倾角预测分支输出维度为N*1*128*128,1代表检测框倾角,N表示模型训练中的批大小。
5.根据权利要求1所述的检测识别方法,其特征在于,所述对教师网络和学生网络分别进行训练,具体为利用图像和标注信息,使用反向传播算法,分别训练教师网络和学生网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;华南理工大学珠海现代产业创新研究院,未经华南理工大学;华南理工大学珠海现代产业创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110300300.1/1.html,转载请声明来源钻瓜专利网。