[发明专利]基于Transformer的人脸识别方法在审
申请号: | 202210991650.1 | 申请日: | 2022-08-18 |
公开(公告)号: | CN115311725A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 高佳玮;葛琦 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/77;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陈月菊 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 transformer 识别 方法 | ||
本发明公开了一种基于Transformer的人脸识别方法,包括如下步骤:S1、获取带有标签的人脸训练图像数据;S2、先经过卷积层进行通道信信息融合;S3、经过6层Transformer Enconder Block编码;S4、经过卷积层进行降维减少参数;S5、经过6层Transformer Decoder Block编码;S6、经过损失函数优化输出数据。本发明用图像的不同patch之间的联合信息提取的方法,可以提高人脸识别表示的运算速度与性能,以及利用位置编码对采样点的人脸进行高维映射,可以很好地映射已有人脸和未知环境人脸之间的关系。
技术领域
本发明属于计算机视觉领域,特别是一种基于Transformer的人脸识别方法。
背景技术
面部识别系统是一种能够从数字图像或视频框架与面部数据库相匹配的技术,通常用于通过ID识别服务对用户进行身份识别,并通过查明和测量给定图像的面部特征来识别用户。
自发明以来,面部识别系统在智能手机和其他形式的技术(例如机器人技术)上看到了更广泛的用途。由于计算机化的面部识别涉及测量人的生理特征,因此面部识别系统被归类为生物识别技术。尽管面部识别系统作为生物识别技术的准确性低于虹膜识别和指纹识别,但由于其非接触式过程,它被广泛采用。面部识别系统已部署在高级人类计算机视频监视和图像的自动索引中。
尽管人类可以毫不费力地识别面孔,但面部识别是计算中具有挑战性的模式识别问题。面部识别系统试图根据其二维图像来识别人脸。但由于人脸实际上是三维的,外观和面部表达的变化都会影响识别的结果。为了完成这项计算任务,面部识别系统执行四个步骤。首先检测用于从图像背景分割面部。在第二步中,分段的面部图像是对齐的,以说明面孔,图像大小和照相特性,例如照明和灰度。对齐过程的目的是使面部特征在第三步(面部特征提取)中准确定位。眼睛,鼻子和嘴巴等特征在图像中被精确定位并测量以表示面部。然后,在第四步中,通过面部建立的特征向量与面部数据库相匹配。
在过去,基于深度卷积神经网络(CNN)的面部识别方法一直在主导该领域,比如三种流行的Deep CNN模型,即AlexNet,VGG-Face和GoogLeNet。他们在所谓的数据集中提供的性能改进非常重要,但是,他们对于大规模数据集的改进非常有限,并且需要设计更大的网络结构,对于现实世界的面部识别量中出现的运动模糊,噪声,压缩伪影,颜色扭曲和遮挡,识别精度可能会出现各种问题。
CNN类网络不能很好地在人脸识别任务上进行泛化。由于面部识别中有许多大型可供训练的数据库,Transformer表现出了出色的性能可以与大型人脸数据库相结合,因此本发明基于Transformer主干网络的基础上提出一种卷积信息融合的人脸识别方案来实现跨域大规模数据人脸识别。由于原始的视觉ViT直接将图像分成若干个patch,因此可能会忽略patch之间的关联,因此本发明在使用Transformer进行编码的时候利用了多个patch之间的联合信息进行综合信息的提取,提高了网络信息利用,加快了训练速度。
发明内容
本发明提出了一种基于Transformer网络进行人脸识别的方法,在Transformer网络的多头自注意力机制基础上加入MP(Mixed Perception)模块进行人脸识别。并且对于传统人脸识别所需的人脸检测和信息处理不同,本发明采用端到端的人脸识别进行检测并识别出人脸身份,省去了训练不同网络带来的繁琐工作。
为实现上述目的,本发明提供了一种基于Transformer网络进行人脸识别的方法,包括如下步骤:
S1、获取带有标签的人脸训练图像数据;
S2、先经过卷积层进行通道信信息融合;
S3、经过6层Transformer Enconder Block编码;
S4、经过卷积层进行降维减少参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210991650.1/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法