[发明专利]一种基于自注意力机制的双分支人脸伪造检测方法在审
申请号: | 202211142745.2 | 申请日: | 2022-09-20 |
公开(公告)号: | CN115546864A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 林凯瀚;韩伟红;李树栋;顾钊铨;梅阳阳;吴晓波 | 申请(专利权)人: | 广州大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/80;G06V10/82;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄卫萍 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 分支 伪造 检测 方法 | ||
1.一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,包括以下步骤:
S1、利用多任务级联卷积神经人脸检测网络获取只包含人脸区域的图像,然后将其输入随机隐写分析丰富模型SRM中获取噪声图像;
S2、将RGB图像和噪声图像分别输入到两个参数不共享的预激活BoT网络即PBoT分支网络中,提取相应的特征,其中,RGB分支用于捕捉视觉伪造伪影,噪声分支通过随机隐写分析丰富模型SRM捕获局部噪声特征的不一致性;
S3、利用双线性池化层对两个网络提取的特征进行融合,利用两个分支的不同特性,并通过全连通层和softmax层来预测输入的人脸图像是否为伪造图像。
2.根据权利要求1所述的一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,步骤S1中的随机隐写分析丰富模型SRM的具体实现过程如下:
S11、随机隐写分析丰富模型SRM将若干不同的子模型组合成一个丰富的噪声分量模型,其中,子模型由线性和非线性高通滤波器得到的噪声残差相邻样本的联合分布形成;
S12、对若干个基本滤波器的输出进行量化和截断,并提取附近的同现信息作为最终特征作为局部噪声描述子;
S13、采用若干个基本滤波器对输入图像进行滤波;
S14、在若干个随机隐写分析丰富模型SRM核函数中随机挑选若干个核函数进行局部噪声特征提取,并将随机隐写分析丰富模型SRM过滤器层的内核大小设置为5×5×3,输出通道大小设置为3。
3.根据权利要求1所述的一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,步骤S2中预激活BoT网络结合了自我注意机制和ResNet的Bottleneck Transformer混合模型,并利用预激活机制对BoT进行改进。
4.根据权利要求3所述的一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,预激活BoT网络使用相同的连接形状PBoT单元调用构建PBoT块。
5.根据权利要求4所述的一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,PBoT块结构为ResNet残差块将3×3卷积层替换为多头自注意力层MHSA,采用MHSA层替换c5的卷积层;在对全局图像进行卷积处理的同时,对捕捉到的特征图信息进行自我注意处理。
6.根据权利要求5所述的一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,在ResNet和BoT中,每个单元用以下公式表示:
yl=H(xl)+F(xl,Wl)
xl+1=f(yl)
其中,xl和xl+1为第l个残差单元的输入和输出,Wl为参数;残差函数定义为F,H为单位映射:H(xl)=xl;函数f是元素添加后的操作,为ReLU函数;将PBoT中的函数f设置为一个恒等映射f(yl)=yl;重新排列激活函数ReLU和BN用于身份映射;将BN层和ReLu层放在权重层之前;PBoT单元写为:
xl+1=xl+F(xl,Wl)。
7.根据权利要求1所述的一种基于自注意力机制的双分支人脸伪造检测方法,其特征在于,步骤S3中双线性池化的具体实现过程如下:
S31、利用紧凑双线性池融合RGB分支和噪声分支的特征,将压缩后的双线性池化层输出如下:
其中,fr为RGB支路特征,fn为噪声支路特征;
S32、将步骤S31中的输出进行矢量化和归一化,如下所示:
S33、通过全连通和softmax层得到二值预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211142745.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浅底色的防蓝光镜片
- 下一篇:一种信用卡额度审核处理方法及装置