[发明专利]一种基于中位值注意力残差网络的猪脸识别方法在审
申请号: | 202210953320.3 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115188029A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 年四成;陶松兵;何启航;刘金珠;张庆文;胡杰杰;吴学栋 | 申请(专利权)人: | 安徽凌坤智能科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06V10/774;G06V10/764;G06N3/08;G06N3/04 |
代理公司: | 合肥和瑞知识产权代理事务所(普通合伙) 34118 | 代理人: | 王挺 |
地址: | 233000 安徽省蚌*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 中位值 注意力 网络 识别 方法 | ||
1.一种基于中位值注意力残差网络的猪脸识别方法,其特征在于,包括通过训练中位值注意力残差网络得到具有最优识别性能的猪脸识别模型,并利用该猪脸识别模型实现猪脸图像的识别,具体包括以下步骤:
步骤1,构建猪脸识别的训练集和测试集
采集M类猪脸图片,其中M记为猪脸的类别数;
对M类猪脸图片的每个类别随机挑选A张猪脸图片,获得M×A张猪脸图片,然后对M×A张猪脸图片采用B种图像预处理方式进行图像增强,并保留每种图像处理方式得到的猪脸图像,即共得到A×M×(B+1)张猪脸图片,该A×M×(B+1)张猪脸图片组成训练集;
在M类猪脸图片的每类中另外挑选C张猪脸图片,获得M×C张猪脸图片,该M×C张猪脸图片组成测试集,A≠C;
步骤2,训练中位值注意力残差网络得到最优分类效果模型,并将最优分类效果模型记为猪脸识别模型,具体步骤如下:
步骤2.1,选取残差网络ResNet50作为主干网络,在主干网络中加入基于中位值压缩的注意力机制,赋予不同通道权值对通道值进行校正,得到中位值注意力残差网络,并记为MAM_ResNet50;
所述MAM_ResNet50的结构包括:一个卷积矩阵大小为7×7、卷积步距为2、通道数为64的卷积层Ω1,一个卷积矩阵大小为3×3、卷积步距为2的最大池化层Λ1,一个由3个相同的中位值注意力残差结构1沿MAM_ResNet50输入-输出方向串联得到的一级中位值注意力残差单元Φ1,一个由4个相同的中位值注意力残差结构2沿MAM_ResNet50输入-输出方向串联得到的二级中位值注意力残差单元Φ2,一个由6个相同的中位值注意力残差结构3沿MAM_ResNet50输入-输出方向串联得到的三级中位值注意力残差单元Φ3,一个由3个相同的中位值注意力残差结构4沿MAM_ResNet50输入-输出方向串联得到的四级中位值注意力残差单元Φ4,一个全局平均池化层Λ2;
MAM_ResNet50的输入依次为卷积层Ω1、最大池化层Λ1、一级中位值注意力残差单元Φ1、二级中位值注意力残差单元Φ2、三级中位值注意力残差单元Φ3、四级中位值注意力残差单元Φ4和全局平均池化层Λ2;
所述中位值注意力残差结构1沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为64的卷积层,卷积矩阵大小为3×3通道数为64的卷积层,卷积矩阵大小为1×1通道数为256的卷积层,在卷积矩阵大小为1×1通道数为256的卷积层后插入基于中位值压缩的注意力机制;
中位值注意力残差结构2沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为128的卷积层,卷积矩阵大小为3×3通道数为128的卷积层,卷积矩阵大小为1×1通道数为512的卷积层,在卷积矩阵大小为1×1通道数为512的卷积层后插入基于中位值压缩的注意力机制;
中位值注意力残差结构3沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为256的卷积层,卷积矩阵大小为3×3通道数为256的卷积层,卷积矩阵大小为1×1通道数为1024的卷积层,在卷积矩阵大小为1×1通道数为1024的卷积层后插入基于中位值压缩的注意力机制;
中位值注意力残差结构4沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为512的卷积层,卷积矩阵大小为3×3通道数为512的卷积层,卷积矩阵大小为1×1通道数为2048的卷积层,在卷积矩阵大小为1×1通道数为2048的卷积层后插入基于中位值压缩的注意力机制;
将基于中位值压缩的注意力机制插入前的卷积层的通道数记为δ,δ或等于256或等于512或等于1024或等于2048;
步骤2.2,利用训练集对步骤2.1所述的MAM_ResNet50进行优化,具体步骤如下:
步骤2.2.1,采用图像归一化处理方式,将训练集中的所有猪脸图像的像素统一调整为I×I;
步骤2.2.2,随机选取训练集中的J张猪脸图像,并将其中任意一个猪脸图像的序号记为x,x=1,2,...,J,将第x张猪脸图像的真实one-hot编码序列记为Hx,其中,q为真实one-hot编码序列Hx中每个真实one-hot编码值的序号,q=1,2,...,M,表示序号为x的猪脸图像在真实one-hot编码序列Hx中的第q个真实one-hot编码值;
真实one-hot编码序列Hx的取值定义为:令且此时中的其他真实one-hot编码值均等于0;
步骤2.2.3,将步骤2.2.2选取得到的J张猪脸图像输入MAM_ResNet50,输出每张猪脸图像的预测one-hot编码序列Xx,其中p为预测one-hot编码序列Xx中每个预测one-hot编码值的序号,p=1,2,...,M,表示序号为x的猪脸图像在预测one-hot编码序列Xx中的第p个预测one-hot编码值;
步骤2.2.4,根据真实one-hot编码序列Hx与预测one-hot编码序列Xx,通过反向传播操作,对MAM_ResNet50的网络权重进行更新优化,具体方式如下:
计算真实one-hot编码序列Hx与预测one-hot编码序列Xx之间的损失函数loss,其中,||·||2表示欧几里得范数;
通过梯度下降法最小化损失函数loss,反向传播更新神经网络元之间连接的权重,完成此次MAM_ResNet50的训练;
步骤2.2.5,重复步骤2.2.2至步骤2.2.4,直至训练集中所有猪脸图像都被选取过;其中,如果最后一轮选取中,训练集剩下的猪脸图像数小于J,则从已经选取过的猪脸图像中随机选取猪脸图像进行补充;
将通过步骤2.2.2到步骤2.2.5完成训练的MAM_ResNet50称为第L轮的MAM_ResNet50,并记为网络TL,其中L为轮数的序号,L=i,2,…G,G为重复次数;
步骤2.3,通过测试集,计算网络TL对测试集分类的正确率PL,为网络TL对测试集中猪脸图像分类正确的数值,
步骤2.4,G次重复步骤2.2至步骤2.3,得到一个网络集合T和一个正确率集合P,T={T1,T2,...,TL,...,TG},P={P1,P2,...,PL,...,PG};
步骤2.5,在正确率集合P中取最大的正确率值记为最大正确率Pmax,在网络集合T中取最大正确率Pmzx对应的MAM_ResNet50网络作为具有最优识别性能的MAM_ResNet50网络,并记为猪脸识别模型;
步骤3,通过猪脸识别模型实现猪脸识别,具体步骤如下:
步骤3.1,将待识别猪脸图像输入至猪脸识别模型,猪脸识别模型对待识别猪脸图像进行特征提取并生成待识别猪脸图像特征序列K,其中K=(k1,k2,...,kw,...,kZ),w表示待识别猪脸图像特征序列的维数,kw表示第w维待识别猪脸图像特征序列的值,w=1,2,...,Z;
步骤3.2,取kτ=max{k1,k2,...,kw,...,kZ},τ对应的待识别猪脸图像特征序列K的维数即为待识别猪脸的类别数,kτ的数值为该类别数的置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽凌坤智能科技有限公司,未经安徽凌坤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210953320.3/1.html,转载请声明来源钻瓜专利网。