[发明专利]基于身份不变特征的深度伪造人脸检测方法、系统及设备在审
申请号: | 202210931430.X | 申请日: | 2022-08-04 |
公开(公告)号: | CN115457622A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 王中元;黄宝金;艾家欣;邹勤;王骞 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V40/40;G06V10/82;G06V10/774 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430072 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 身份 不变 特征 深度 伪造 检测 方法 系统 设备 | ||
1.一种基于身份不变特征的深度伪造人脸检测方法,其特征在于,包括以下步骤:
步骤1:将待检测的伪造人脸图像和目标人脸图像预处理成预设大小112×112×3,然后分别输入到ResNet50主干特征提取网络中,得到伪造人脸图像的身份特征f和目标人脸图像的身份特征g;其中,所述目标人脸图像为利用原始人脸图像伪造获得的人脸图像;
步骤2:计算身份特征f和身份特征g之间的余弦相似度,作为待检测人脸和目标人脸的身份相似度;身份相似度小于预设值即待检测人脸图像为伪造图像;
所述ResNet50主干特征提取网络,包括入口流层、中间流层和出口流层;所述入口流层是将一张112×112×3的图片转换为一个112×112×64的特征图,包含1个7×7卷积和一个最大池化层;所述中间流层包含4个阶段,依次包含3、4、6、3个残差块,每个残差块由1个1×1卷积、1个3×3卷积和1个1×1的卷积组成;所述出口流层是将一张7×7×512的特征图转化为一个512维的特征向量,包含一个平均池化层。
2.根据权利要求1所述的基于身份不变特征的深度伪造人脸检测方法,其特征在于:步骤1中所述预处理,是通过RetinaFace人脸检测算法检测人脸区域,提取5个面部特征点,包括左眼、右眼、鼻子、左边嘴角和右边嘴角;通过面部特征点将面部对齐,使得对齐后的人脸位于图像中心;将图片通过opencv调整大小为长112像素、宽112像素、3通道数;识别每个图像的人脸区域并进行裁剪;通过人脸特征点将人脸对齐,使得对齐后的人脸位于图像中心。
3.根据权利要求1或2所述的基于身份不变特征的深度伪造人脸检测方法,其特征在于:所述ResNet50主干特征提取网络,为训练好的ResNet50主干特征提取网络;其训练过程具体包括以下步骤:
(1)采集若干不同身份的原始人脸图像以及用其伪造获得的伪造人脸图像,伪造人脸图像的身份用其对应的原始人脸图像的身份表示;
(2)对于每一个人脸样本,通过ResNet50主干特征提取网络提取身份特征feat,然后计算feat与对应的身份标签的ArcFace损失;
(3)计算出损失后,使用Adam优化器对ResNet50主干特征提取网络进行反向传播并优化,使得伪造人脸图像与对应原始人脸图像的身份保持一致;
(4)重复步骤(1)-(4),训练ResNet50主干特征提取网络至收敛,获得训练好的ResNet50主干特征提取网络。
4.根据权利要求3所述的基于身份不变特征的深度伪造人脸检测方法,其特征在于:步骤(1)中,将原始人脸视频、及其对应的伪造人脸视频中选取从指定帧开始的、固定帧数间隔的帧图像;使得原始人脸视频帧、伪造人脸视频帧一一对应;生成原始人脸-伪造人脸图像样本;
对伪造人脸视频、原始人脸视频的图像进行预处理,通过人脸检测技术,识别每个图像的人脸区域并进行裁剪;通过人脸特征点将人脸对齐,使得对齐后的人脸位于图像中心。
5.根据权利要求3所述的基于身份不变特征的深度伪造人脸检测方法,其特征在于:步骤(2)中,所述ArcFace损失为:
其中,N表示一个Batch中的样本数量,θj表示第i个样本提取的身份特征与第j个类别向量的夹角,表示第i个样本提取的身份特征与它对应的标签类别向量的夹角,m表示间隔超参数,s表示尺度扩大超参数,n表示分类类别数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210931430.X/1.html,转载请声明来源钻瓜专利网。