[发明专利]基于关键帧人脸特征的人脸交换篡改视频检测方法、系统及介质有效
申请号: | 202110755746.3 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113469062B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 卢伟;祝恺蔓 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G06V10/25;G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关键 帧人脸 特征 交换 篡改 视频 检测 方法 系统 介质 | ||
1.基于关键帧人脸特征的人脸交换篡改视频检测方法,其特征在于,包括下述步骤:
将视频数据集划分为训练集和测试集,对每个视频流提取设定数量的关键帧;
对提取的关键帧进行人脸定位,提取所有人脸区域图像并保留脸部边缘背景;
对保留脸部边缘背景的人脸区域图像再次检测与定位,获取紧密人脸区域图像;
将紧密人脸区域图像输入到人脸识别任务中训练好的神经网络中,获取人脸图像特征表示;
将训练集视频的多个关键帧上的人脸图像特征表示作为一组输入,对长短期记忆网络和线性判别器进行训练,具体为:
使用三层叠加的前向长短期记忆网络LSTM对特征进行聚合,其每一层的结构中包括一个输入门it、一个遗忘门ft、一个记忆门gt、一个输出门ot,对输入序列中的每个成员计算隐藏状态ht,记忆单元ct,计算公式如下:
it=σ(wiixt+bii+whiht-1+bhi)
ft=σ(wifxt+bif+whfht-1+bhf)
ot=σ(wioxt+bio+whoht-1+bho)
其中σ表示非线性激活函数sigmoid;xt表示第t帧的人脸特征向量,wii、wif、wio分别表示输入门、遗忘门、输出门对xt进行线性变换的权重矩阵,bii、bif、bio分别表示三个线性变换的偏置;ht-1表示第t-1帧人脸特征向量经过LSTM计算后得到的隐藏向量,whi、whf、who分别表示输入门、遗忘门、输出门对ht-1进行线性变换的权重矩阵,bhi、bhf、bho分别表示三个线性变换的偏置;
三个门控单元在计算的时候结合每个时刻的人脸特征上一时刻的隐藏状态,上一时刻的隐藏状态在初始化的时候设为全零向量;
gt=Tanh(wigxt+big+whght-1+bhg)
ct=ft⊙ct-1+it⊙gt
ht=ot⊙tanh(ct)
其中,⊙表示哈达玛积,即两个向量中相同对应位置的元素进行相乘;wig、big表示记忆门对xt进行线性变换的权重矩阵和偏置,whg、bhg表示记忆门对ht-1进行线性变换的权重矩阵和偏置;ct-1表示第t-1帧经过相同计算得到的保留信息向量;tanh()表示双曲正切激活函数;
所述记忆单元ct通过有选择性地使用当前人脸特征结合上一时刻的隐藏向量经过非线性激活函数的计算特征与上一时刻的记忆单元信息,保持长期的记忆功能;输出的隐藏状态ht在记忆单元ct的基础上经过进一步的非线性变换获得,输入给下一层的LSTM;
获取最后一层LSTM的最后一个人脸特征对应的输出隐藏向量,先使用线性层映射到128维度,经过ReLU非线性激活函数后,再将其映射到2维的分类空间,并使用softmax进行归一化求得两个概率值;
在训练集上,通过最小化交叉熵损失函数在训练集上对长短期记忆网络和线性判别器进行反向传播更新参数,对于一个样本的具体计算公式为:
其中,L表示损失函数,y表示该人脸视频的真实标签,表示对应计算得到的概率值;
将测试集视频的多个关键帧上的人脸图像特征表示作为一组输入,输入到长短期记忆网络中,将最后一个图像对应的输出经过线性判别器,得到检测结果并评估检测性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110755746.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自发电式流量计
- 下一篇:多泵并联协调控制方法、系统、计算机设备及存储介质