[发明专利]一种基于孪生网络的标签缺陷检测算法在审

申请号：	201910538938.1	申请日：	2019-06-20
公开（公告）号：	CN110222792A	公开（公告）日：	2019-09-10
发明（设计）人：	李竹;王韵涛;郭晨洁;盛庆华	申请（专利权）人：	杭州电子科技大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G01N21/88
代理公司：	浙江永鼎律师事务所 33233	代理人：	陆永强
地址：	310018***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于孪生网络的标签缺陷检测算法，步骤S1：训练集和测试集的获取；步骤S2：网络搭建和训练；步骤S3：测试集验证。采用本发明的技术方案，搭建孪生网络标签缺陷检测系统，投入获取到标签数据集进行训练，再采用softmax进行分类，只需要训练几种类型的标签，测试时即使待测标签类型不在训练集中，一样可以进行缺陷检测，能有效减少准备工作工作量，提高检测效率以及降低成本。
搜索关键词：	缺陷检测算法标签测试集缺陷检测系统标签类型标签数据缺陷检测网络标签网络搭建有效减少训练集工作量网络验证测试分类检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于孪生网络的标签缺陷检测算法，其特征在于，包括以下步骤：步骤S1：获取标签数据集，其中，训练集包含各种标签缺损种类，并划分为训练集、验证集和测试集；步骤S2：搭建孪生网络并用训练集数据训练该孪生网络；步骤S3：测试集验证训练好的孪生网络，并通过使用不同类型字符模拟不同类型标签；其中，所述步骤S1进一步包括：步骤S11：搜集标签，截取字符区域，得到无污损和有污损图片N张，用来作为模拟标签；取模拟标签中N₁张作为验证集，N₂张作为测试集，N₃张作为训练集，其中，N₁+N₂+N₃＝N，且三种数据集中，正常标签和M种缺陷标签数量服从均匀分布；步骤S12：将训练集中的图片转换为tfrecord格式，同时为有无污损的图片贴上相应“label”，以便于确定代价函数计算公式的y值；之后对训练集打乱顺序制作batch，以便实现分批训练；所述步骤S2进一步包括：步骤S21：孪生网络搭建，采用2个卷积神经网络模型VGG16网络作为卷积神经网络框架，其中每个VGG16模型包括5个卷积段，13个卷积层，5个最大化池化层，3个全连接层；使用3*3卷积核提取特征；输入n对大小为224×224的图像到两个共享权值的VGG16模型，输出两个1000维特征f₁、f₂，分别用于预测输入图像的行人身份受识别标签d，再用平方层来比较高维特征f₁、f₂，使其共同预测验证标签s；步骤S22：孪生网络的训练；将训练集投入孪生网络中训练，由于两个VGG16网络之间共享权值，两个输入通过同一卷积神经网络学习提取特征；VGGNet由5段卷积构成，每段卷积包括2～3层卷积层，最后一层卷积层后面都有一个最大池化层来压缩图片，降维去冗；每一段的卷积层都具有相同的卷积核数，每增加一段，该段内卷积层的卷积核数就增加1倍；如下是一个VGG16网络结构：第一个卷积段，VGG网络的第一层卷积的输入图像大小为224×224×3，经过64个3*3*3的卷积核，以步长为1进行卷积，输出一张224*224*64的特征图，第二层卷积输入图像大小和输出图像大小均为224*224*64；然后经过以2*2的最大化池化层，步长为2，得到112*112*64特征图；第二个卷积段，这个卷积段与第一个卷积段像素，但是经过这段的两个卷积层后输出通道变成128，输出为112*112*128；最大化池化层与第一段最大化池化层一样，因此输出尺寸变为56*56*128；第三个卷积段，这段卷积层的个数由之前的两个变成3个，然后输出通道变为256，输出56*56*256，经过与之前一致的池化层，输出尺寸变为28*28*256；第四个卷积段，卷积层的通道数依旧翻倍，变成512，最后经过池化层，输出尺寸变成14*14*512；第五个卷积段，这一段卷积层的通道数维持在512，经过最大化池化层之后，输出变为7*7*512；经过13层卷积层后，VGG16网络进入3个全连接层，第一个和第二个全连接层有4096个单元，第三个全连接层有1000个单元，最后输出维度为1000的特征；步骤S23：通过计算损失函数，将其作为参考通过反向传播算法训练卷积神经网络，优化相应的权重偏置等参数，让卷积神经网络更好地提取特征，最终实现训练样本的完美拟合；采用的损失函数(loss)如下式所示：其中，L为损失函数值；y表示输入图像标签相似度，y＝0表示输入样本input1与input2不相似，y＝1则表示输入样本相似；d_n表示两个输入样本之间的欧氏距离，其中：d_n＝||G_w(X1)‑G_w(X2)||margin用于在G_w(x)定义一个边界，表示当输入一个正样本和一个负样本时，只有距离有小于这个值时才会对损失函数有影响；所述步骤S3进一步包括：步骤S31：双输入中其一为已知正确标签；步骤S32：另外一个通道输入待测标签；步骤S33：构造函数f(z，x)计算相似度，其中，z为比较模板图像，x为同样大小的侯选图像，φ为卷积内嵌函数，b表示在每个位置上的不同偏置值；该孪生框架的输出为一张得分图，如果这两个图像描述的是相同物体，返回高分，否则返回低分；步骤S35：通过softmax实时监测网络关于训练集和验证集的分类正确率，每完成100次输出一次平均正确率；网络每批训练64(32*2)张图片，迭代N次时，loss稳定近乎0略有小波动，在训练集上的准确率稳定为100％，在验证集上的分类准确率也稳定超过99％，完成训练。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910538938.1/，转载请声明来源钻瓜专利网。

上一篇：样本标注信息的审核方法及装置
下一篇：基于多视角主动学习的在线半监督分类方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于孪生网络的标签缺陷检测算法在审

专利文献下载