[发明专利]一种基于CNN的保持表情信息的人脸转移方法有效
申请号: | 201810237576.8 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108647560B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 曾坤;潘文优;陈湘萍 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06K9/62;G06N3/08;G06V10/774;G06V10/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cnn 保持 表情 信息 转移 方法 | ||
1.一种基于CNN的保持表情信息的人脸转移方法,其特征在于,所述方法包括:
从网络以及人脸数据库中获取人脸图片,以及对人脸图片的表情分类的标记信息,组成照片库;
从照片库中选取两张照片作为一组样本,图片A作为身份信息图,图片B作为表情信息图;
将较高像素图片下采样到较低像素图片的大小,使二者等大;
使用AdaBoost算法对图A和图B进行人脸区域检测与分割;
将图A和图B的人脸区域组合成组合通道,作为输入数据输入到生成式CNN网络中,通过前向传播生成一张合成人脸;
将合成人脸与图B非人脸区域进行泊松融合;
将合成人脸与图A人脸区域输入到FaceNet神经网络中,得到识别信息的损失L1;
将合成人脸与图B人脸区域输入到深度ConvNets中求出表情特征信息损失L2;
结合L1和L2的损失值,对生成式CNN网络进行反向传播,更新网络权重;
最后重复训练生成式CNN网络;
其中,所述人脸区域组合成组合通道作为输入数据输入到生成式CNN网络,该网络具体包括:
编码器:编码器是一个特征提取以及下采样的过程;它分为卷积层和池化层;卷积核是一个n乘n的权重矩阵,它对图片中的感受野进行抽象,即对该感受野的像素求线性和,并且通过ReLU激活函数得到该感受野的激活值;池化层是对一块区域进行下采样的过程,网络中全部采用2倍下采样,下采样方法具有位置不变的性质;编码器采用4个卷积层加一层全连接层,每一层卷积层后都会接一个下采样的池化层;从第1层到第4层的维度分别是(100,256,256,3),(100,128,128,24),(100,64,64,64),(100,32,32,128),卷积核的大小为3乘3,维度与神经网络的维度一致;全连接层是把第四层的4维序列展开成2维,维度为(100,131072);
在连接全连接网络之后,为drop-out层;该层作用在于训练时每一次前向传播都忽略掉部分连接参数,使得每一次训练时网络的数据流都不同,但又不改变网络的特征提取方向,从而避免网络过拟合;同时,由于训练时参数变少,可以节省部分计算资源;
解码器:解码器有上采样和反卷积的过程,上采样的过程采用插值法,通过获取低像素相邻的像素获得线性值;反卷积的过程就是正向卷积的镜像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810237576.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的危险物识别方法
- 下一篇:一种指纹鉴定方法