[发明专利]一种基于孪生网络的标签缺陷检测算法在审

专利信息
申请号: 201910538938.1 申请日: 2019-06-20
公开(公告)号: CN110222792A 公开(公告)日: 2019-09-10
发明(设计)人: 李竹;王韵涛;郭晨洁;盛庆华 申请(专利权)人: 杭州电子科技大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G01N21/88
代理公司: 浙江永鼎律师事务所 33233 代理人: 陆永强
地址: 310018*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于孪生网络的标签缺陷检测算法,步骤S1:训练集和测试集的获取;步骤S2:网络搭建和训练;步骤S3:测试集验证。采用本发明的技术方案,搭建孪生网络标签缺陷检测系统,投入获取到标签数据集进行训练,再采用softmax进行分类,只需要训练几种类型的标签,测试时即使待测标签类型不在训练集中,一样可以进行缺陷检测,能有效减少准备工作工作量,提高检测效率以及降低成本。
搜索关键词: 缺陷检测算法 标签 测试集 缺陷检测系统 标签类型 标签数据 缺陷检测 网络标签 网络搭建 有效减少 训练集 工作量 网络 验证 测试 分类 检测
【主权项】:
1.一种基于孪生网络的标签缺陷检测算法,其特征在于,包括以下步骤:步骤S1:获取标签数据集,其中,训练集包含各种标签缺损种类,并划分为训练集、验证集和测试集;步骤S2:搭建孪生网络并用训练集数据训练该孪生网络;步骤S3:测试集验证训练好的孪生网络,并通过使用不同类型字符模拟不同类型标签;其中,所述步骤S1进一步包括:步骤S11:搜集标签,截取字符区域,得到无污损和有污损图片N张,用来作为模拟标签;取模拟标签中N1张作为验证集,N2张作为测试集,N3张作为训练集,其中,N1+N2+N3=N,且三种数据集中,正常标签和M种缺陷标签数量服从均匀分布;步骤S12:将训练集中的图片转换为tfrecord格式,同时为有无污损的图片贴上相应“label”,以便于确定代价函数计算公式的y值;之后对训练集打乱顺序制作batch,以便实现分批训练;所述步骤S2进一步包括:步骤S21:孪生网络搭建,采用2个卷积神经网络模型VGG16网络作为卷积神经网络框架,其中每个VGG16模型包括5个卷积段,13个卷积层,5个最大化池化层,3个全连接层;使用3*3卷积核提取特征;输入n对大小为224×224的图像到两个共享权值的VGG16模型,输出两个1000维特征f1、f2,分别用于预测输入图像的行人身份受识别标签d,再用平方层来比较高维特征f1、f2,使其共同预测验证标签s;步骤S22:孪生网络的训练;将训练集投入孪生网络中训练,由于两个VGG16网络之间共享权值,两个输入通过同一卷积神经网络学习提取特征;VGGNet由5段卷积构成,每段卷积包括2~3层卷积层,最后一层卷积层后面都有一个最大池化层来压缩图片,降维去冗;每一段的卷积层都具有相同的卷积核数,每增加一段,该段内卷积层的卷积核数就增加1倍;如下是一个VGG16网络结构:第一个卷积段,VGG网络的第一层卷积的输入图像大小为224×224×3,经过64个3*3*3的卷积核,以步长为1进行卷积,输出一张224*224*64的特征图,第二层卷积输入图像大小和输出图像大小均为224*224*64;然后经过以2*2的最大化池化层,步长为2,得到112*112*64特征图;第二个卷积段,这个卷积段与第一个卷积段像素,但是经过这段的两个卷积层后输出通道变成128,输出为112*112*128;最大化池化层与第一段最大化池化层一样,因此输出尺寸变为56*56*128;第三个卷积段,这段卷积层的个数由之前的两个变成3个,然后输出通道变为256,输出56*56*256,经过与之前一致的池化层,输出尺寸变为28*28*256;第四个卷积段,卷积层的通道数依旧翻倍,变成512,最后经过池化层,输出尺寸变成14*14*512;第五个卷积段,这一段卷积层的通道数维持在512,经过最大化池化层之后,输出变为7*7*512;经过13层卷积层后,VGG16网络进入3个全连接层,第一个和第二个全连接层有4096个单元,第三个全连接层有1000个单元,最后输出维度为1000的特征;步骤S23:通过计算损失函数,将其作为参考通过反向传播算法训练卷积神经网络,优化相应的权重偏置等参数,让卷积神经网络更好地提取特征,最终实现训练样本的完美拟合;采用的损失函数(loss)如下式所示:其中,L为损失函数值;y表示输入图像标签相似度,y=0表示输入样本input1与input2不相似,y=1则表示输入样本相似;dn表示两个输入样本之间的欧氏距离,其中:dn=||Gw(X1)‑Gw(X2)||margin用于在Gw(x)定义一个边界,表示当输入一个正样本和一个负样本时,只有距离有小于这个值时才会对损失函数有影响;所述步骤S3进一步包括:步骤S31:双输入中其一为已知正确标签;步骤S32:另外一个通道输入待测标签;步骤S33:构造函数f(z,x)计算相似度,其中,z为比较模板图像,x为同样大小的侯选图像,φ为卷积内嵌函数,b表示在每个位置上的不同偏置值;该孪生框架的输出为一张得分图,如果这两个图像描述的是相同物体,返回高分,否则返回低分;步骤S35:通过softmax实时监测网络关于训练集和验证集的分类正确率,每完成100次输出一次平均正确率;网络每批训练64(32*2)张图片,迭代N次时,loss稳定近乎0略有小波动,在训练集上的准确率稳定为100%,在验证集上的分类准确率也稳定超过99%,完成训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910538938.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top