[发明专利]基于深度哈希网络的铸件缺陷图像检测方法在审
申请号: | 201810766116.4 | 申请日: | 2018-07-12 |
公开(公告)号: | CN108986091A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 孙志毅;杨凯;王安红;刘瑞珍;吴贺贺 | 申请(专利权)人: | 太原科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/62 |
代理公司: | 北京国坤专利代理事务所(普通合伙) 11491 | 代理人: | 赵红霞 |
地址: | 030024 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入图像 迭代 预处理 卷积神经网络 哈希网络 图像检测 铸件缺陷 连接层 池化 哈希 材料铸件 分类结果 检测领域 缺陷图像 图像分类 图像输入 图像特征 网络模型 训练网络 输出 初始化 数据集 正确率 卷积 网络 图像 测试 分类 概率 | ||
1.一种基于深度哈希网络的铸件缺陷图像检测方法,其特征是包括下列步骤:
a、在ImageNet上预训练一个卷积神经网络;
b、输入图像,并对输入图像进行预处理;
c、已预处理的图像开始进入深度哈希网络的第一个卷积层,并将第一个卷积层的输出结果进行max-pooling运算;
d、上一层的输出结果进入第二个卷积层,并将第二个卷积层的输出结果进行max-pooling运算;
e、上一层的输出结果进入第三个卷积层,进行卷积运算,将第三层的输出结果输入第四个卷积层,再进行卷积运算
f、上一层的输出结果进入第五个卷积层,并将第五个卷积层的输出结果进行max-pooling运算;
g、上一层的输出结果进入深度哈希网络的两个全连接层;
h、上一层的输出结果进入深度哈希网络的哈希层;
i、上一层的输出结果进入深度哈希网络的最后一层,得到图像属于有缺陷与无缺陷两个类别的概率,得出图像分类结果。
2.根据权利要求1所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤a中,所述预训练一个卷积神经网络的方法是基于AlexNet图像分类网络,使用此框架在ImageNet上训练网络,得到的网络参数用于训练特定材料铸件图像深度哈希网络的初始参数。
3.根据权利要求1所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤b中,网络训练开始之前,网络会计算产生一个均值文件,对于训练集中的每副图像,在进入网络后会在每一个像素点上减去这个全局均值。进入网络训练的图像,会随机裁剪成227×227的碎片。
4.根据权利要求1所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤c-h中,网络的进程可以表示成从网络的上一层到网络下一层的一种非线性关系:其中是对于输入图像经过第p层的图像特征输出,Wp和bp分别是第p层的权重和偏置项,fp是ReLu激活函数,其表达式为fp(x)=max(0,x),其中x表示卷积层和全连接层的输出,每一层卷积和全连接层都使用ReLu激活函数,但是在第一层和第二层的ReLu前要进行局部响应归一化操作。
5.根据权利要求4所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤c、d中,在使用激活函数之前要进行局部响应归一化LRN,活性定义为:其中∑(...)表示在相同空间位置上转换n个相邻的核映射,N是该层中核的总数,k,n,α,和β是超参数,表示在位置(x,y)处的像素点通过应用核计算出的神经元激活度。
6.根据权利要求1或5所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤c、d和f中,池化运算是在第一个LRN,第二个LRN以及第5层卷积后进行的,采用的方式为最大值池化。
7.根据权利要求1所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤g中,全连接层中采用dropout技术,作用是按0.5的概率使得这两层中每个神经元的输出为0,去除的神经元不参与网络的前向与反向转播。输入的图像在不断变化,神经网络就会有不同的结构,但是这些结构之间的权值是共享的。
8.根据权利要求1所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤h中,哈希层的激活函数为sigmiod,假设二进制码的长度为k,它的表达式为:其中hi是哈希层的图像特征向量输出,β是超参数。
9.根据权利要求8所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤h中,哈希层的输出为二进制编码,二进制编码通过一个阈值函数,二进制码的长度为k,其表达式为
10.根据权利要求8所述的基于深度哈希网络的铸件缺陷图像检测方法,其特征在于,步骤h中,哈希层采用了一种分块模型,假设哈希层输出的图像特征向量为m,将图像特征向量分为k个块,每块包含向量维数为m/k,其中m是k的倍数,其中特征向量的尺寸可以通过控制第7层全连接层的输出单元数量来确定,然后通过一个全连接层将每块映射成一维数字,再通过sigmoid函数将输出限制在[0,1]范围内,最后将这些值经过阈值函数生成紧凑简洁的二进制码。假设给定训练数据为A={A1,A2,...,An},每个数据都有一个属于该类别的标签,经过哈希层后可以得到它们的哈希码AH={H1,H2,...,Hn},对于一个待测试图像Aq,经过哈希层后其哈希编码为Hq,如果Hq与Hi的汉明距离小于设定的阈值,此时可以得到与Aq相关的数据集此时在欧几里得空间中,通过比较每张图像的最后一层全连接输出的特征向量来确定测试图像和相关数据集S中哪张图像最相近,Vq和ViS分别表示图像Aq和从网络第7层输出的特征向量,定义欧几里得距离ei=||Vq-ViS||.,ei的值越小,说明两张图像的相似性越高,然后再参照两张图像是否有相同的标签信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学,未经太原科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810766116.4/1.html,转载请声明来源钻瓜专利网。