[发明专利]基于多时序注意力网络对人脸伪造视频检测方法在审
申请号: | 202211279833.7 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115512448A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 茹一伟;孙哲南;何召峰 | 申请(专利权)人: | 天津中科智能识别有限公司 |
主分类号: | G06V40/40 | 分类号: | G06V40/40;G06V40/16;G06V20/40;G06V10/80;G06V10/82 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300450 天津市滨海新区天津经济技*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多时 注意力 网络 伪造 视频 检测 方法 | ||
1.基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,包括:
对输入的视频序列由起始帧起进行人脸检测、跟踪,识别出同一人脸后存储为待处理的人脸序列;
网络对人脸序列按不同时序采样率降采样,得到浏览序列、审视序列;
对审视序列中的帧提取注意力特征图;
浏览分支网络每次通过卷积操作提取到浏览序列中帧的特征图后,与审视分支网络每一层输出的特征图通过侧向连接融合,融合后特征图作为浏览分支网络下一卷积的输入;审视分支网络每次卷积操作提取到审视序列中帧的特征图后,与对应的注意力特征图相乘后输出;
全连接层对浏览分支网络、审视分支网络各自卷积处理的输出结果融合,最后输出识别结果。
2.根据权利要求1所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,所述浏览分支网络、审视分支网络进行卷积操作的每一层的卷积核大小相同。
3.根据权利要求2所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,所述浏览分支网络进行卷积操作的每一层的卷积核的数量是所述审视分支网络的每一层的卷积核的数量β倍,α×β=1,浏览序列的长度为审视序列长度的α倍。
4.根据权利要求1所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,所述侧向连接融合采用稠密卷积融合,其实现步骤如下:
对浏览分支网络形成的特征图用3D卷积网络处理,将每一帧的特征图个数降低,然后将得到的特征图与审视分支网络形成的特征图按照对应关系连接,进行融合,得到对应的融合特征图。
5.根据权利要求4所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,所述对浏览分支网络形成的特征图用3D卷积网络处理的采样间隔为1/α,每隔1/α帧取一帧进行处理。
6.根据权利要求1所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,采用预训练的网络来对审视序列中的帧提取注意力特征图。
7.根据权利要求6所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,采用预训练的U-Net网络来对审视序列中的帧提取注意力特征图。
8.根据权利要求7所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,训练的U-Net网络时,基于数据集中真实人脸与伪造人脸存在对应关系,通过正负样本间做差,得到伪造人脸对于真实人脸的伪造区域,从而得到帧的注意力特征图。
9.根据权利要求7或8所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,对所述U-Net网络训练时,引入软注意力标签,将软注意力标签作为真实人脸图像的标签取代真实人脸图像对网络训练,将真实人脸图像表示为RImage,真实人脸图像压缩率为ρ(0ρ1),真实人脸图像的软标签表示为Slabel,ρ×RImage代表真实人脸图像压缩ρ倍,即真实人脸图像的分辨率从(W,H)压缩为(ρ×W,ρ×H),真实人脸图像的软标签的表达式如下:
Slabel=(ρ×RImage)×(1/p)-RImage。
10.根据权利要求1所述基于多时序注意力网络对人脸伪造视频检测方法,其特征在于,在检测过程中,所述浏览分支网络对人脸序列的扫描帧率大于所述审视分支网络的扫描帧率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津中科智能识别有限公司,未经天津中科智能识别有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211279833.7/1.html,转载请声明来源钻瓜专利网。