[发明专利]基于Transformer的人脸识别方法在审
申请号: | 202210991650.1 | 申请日: | 2022-08-18 |
公开(公告)号: | CN115311725A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 高佳玮;葛琦 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/77;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陈月菊 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 transformer 识别 方法 | ||
1.一种基于Transformer的人脸识别方法,其特征在于,包括如下步骤:
S1、获取带有标签的人脸训练图像数据;
S2、先经过卷积层进行通道信信息融合;
S3、经过6层Transformer Enconder Block编码;
S4、经过卷积层进行降维减少参数;
S5、经过6层Transformer Decoder Block编码;
S6、经过损失函数优化输出数据。
2.根据权利要求1所述的基于Transformer的人脸识别方法,其特征在于,在S1中,采用MS-Celeb-1M数据集进行训练。
3.根据权利要求2所述的基于Transformer的人脸识别方法,其特征在于,在S1中,采用LFW数据集进行泛化测试的人脸模板分析比对法。
4.根据权利要求1所述的基于Transformer的人脸识别方法,其特征在于,在S2中,采用的卷积层,包括Conv n×n和Conv 1×1两部分。
5.根据权利要求1所述的基于Transformer的人脸识别方法,其特征在于,在S3中,从图像X∈RW×W×C中提取出补丁大小为P、步长为S的滑动面片,得到一系列平坦的二维补丁(W,W)是原始图像的分辨率,而(P,P)是每个图像面片的分辨率,有效序列长度就是面片数其中,p是零填充数量;
可学习的嵌入被连接到补丁嵌入,并且它在Transformer编码器输出的状态是最终的人脸图像嵌入,如公式2所示;然后,将位置嵌入添加到补片嵌入中,以保留位置信息,最终嵌入:
用作Transformer的输入,
将编码好的参数送入
6.根据权利要求1所述的基于Transformer的人脸识别方法,其特征在于,在S4中,采用的卷积层,包括Conv n×n和Conv 1×1两部分。
7.根据权利要求1所述的基于Transformer的人脸识别方法,其特征在于,在S5中,包括多头自注意力MSA和全连接MLP块,在每个块之前经过层归一化,在每个块之后具有剩余连接;
Transformer的关键块之一,MSA,是由k与并行的自注意SA共同组成的,
其中,x∈R(N+1)×D是输入序列,是线性变换的权重矩阵,是注意力分布图;MSA的输出是k注意头部输出的连接;
MSA(z)=[SA1(z);SA2(z);…;SAk(z)]Umsa, (4)
其中,
8.根据权利要求1所述的基于Transformer的人脸识别方法,其特征在于,在S6中,损失函数为:
其中,y是标签,Py是将x归入y类的预测概率,C是身份数字,Wj是最后完全连接的层的重量的j-th列,bj∈Rc是偏差。
9.根据权利要求8所述的基于Transformer的人脸识别方法,其特征在于,基于Softmax的损失函数去除了偏置项并进行了WjTX=scosθj变换,并在cosθyi项中加入较大的余量;基于Softmax的最终的损失函数可以表示为:
其中,在CosFace中,f(θyi)=cosθyi-m。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210991650.1/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法