[发明专利]一种基于CNN的保持表情信息的人脸转移方法有效

专利信息
申请号: 201810237576.8 申请日: 2018-03-22
公开(公告)号: CN108647560B 公开(公告)日: 2022-06-14
发明(设计)人: 曾坤;潘文优;陈湘萍 申请(专利权)人: 中山大学
主分类号: G06V40/16 分类号: G06V40/16;G06K9/62;G06N3/08;G06V10/774;G06V10/80
代理公司: 暂无信息 代理人: 暂无信息
地址: 510006 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 cnn 保持 表情 信息 转移 方法
【权利要求书】:

1.一种基于CNN的保持表情信息的人脸转移方法,其特征在于,所述方法包括:

从网络以及人脸数据库中获取人脸图片,以及对人脸图片的表情分类的标记信息,组成照片库;

从照片库中选取两张照片作为一组样本,图片A作为身份信息图,图片B作为表情信息图;

将较高像素图片下采样到较低像素图片的大小,使二者等大;

使用AdaBoost算法对图A和图B进行人脸区域检测与分割;

将图A和图B的人脸区域组合成组合通道,作为输入数据输入到生成式CNN网络中,通过前向传播生成一张合成人脸;

将合成人脸与图B非人脸区域进行泊松融合;

将合成人脸与图A人脸区域输入到FaceNet神经网络中,得到识别信息的损失L1;

将合成人脸与图B人脸区域输入到深度ConvNets中求出表情特征信息损失L2;

结合L1和L2的损失值,对生成式CNN网络进行反向传播,更新网络权重;

最后重复训练生成式CNN网络;

其中,所述人脸区域组合成组合通道作为输入数据输入到生成式CNN网络,该网络具体包括:

编码器:编码器是一个特征提取以及下采样的过程;它分为卷积层和池化层;卷积核是一个n乘n的权重矩阵,它对图片中的感受野进行抽象,即对该感受野的像素求线性和,并且通过ReLU激活函数得到该感受野的激活值;池化层是对一块区域进行下采样的过程,网络中全部采用2倍下采样,下采样方法具有位置不变的性质;编码器采用4个卷积层加一层全连接层,每一层卷积层后都会接一个下采样的池化层;从第1层到第4层的维度分别是(100,256,256,3),(100,128,128,24),(100,64,64,64),(100,32,32,128),卷积核的大小为3乘3,维度与神经网络的维度一致;全连接层是把第四层的4维序列展开成2维,维度为(100,131072);

在连接全连接网络之后,为drop-out层;该层作用在于训练时每一次前向传播都忽略掉部分连接参数,使得每一次训练时网络的数据流都不同,但又不改变网络的特征提取方向,从而避免网络过拟合;同时,由于训练时参数变少,可以节省部分计算资源;

解码器:解码器有上采样和反卷积的过程,上采样的过程采用插值法,通过获取低像素相邻的像素获得线性值;反卷积的过程就是正向卷积的镜像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810237576.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top