[发明专利]一种基于神经网络的肖像漫画生成方法有效

专利信息
申请号: 201811631295.7 申请日: 2018-12-29
公开(公告)号: CN109741247B 公开(公告)日: 2020-04-21
发明(设计)人: 吕建成;汤臣薇;徐坤;贺喆南;李婵娟 申请(专利权)人: 四川大学
主分类号: G06T3/00 分类号: G06T3/00;G06N3/04;G06N3/08
代理公司: 成都正华专利代理事务所(普通合伙) 51229 代理人: 李林合
地址: 610064 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 神经网络 肖像 漫画 生成 方法
【权利要求书】:

1.一种基于神经网络的肖像漫画生成方法,其特征在于,包括以下步骤:

S1、提取真实人脸图像中人脸面部的结构特征,并将提取的结构特征数据转化为序列特征数据;

S2、将序列特征数据输入到训练好的Seq2Seq VAE模型中,生成人脸图像对应的夸张结构序列点;

S3、利用薄板样条插值技术,将生成的夸张结构序列点应用于真实人脸图像中,实现对真实人脸图像的夸张变形;

S4、利用CycleGAN技术,将漫画风格应用于夸张变形后的人脸图像上,生成肖像漫画;

所述步骤S1中人脸面部的结构特征包括人脸面部的轮廓结构特征和五官结构特征;

所述步骤S1具体为:

提取真实人脸图像的68个序列点来作为人脸面部的结构特征数据,并根据每个序列点的绝对坐标值,得到每个序列点相对于前一个序列点的偏移坐标序列,该偏移坐标序列即为序列特征数据;

其中,每个序列点均为添加了状态值的序列点,添加了状态值的序列点表示为Q(x,y,p1,p2,p3);

其中x和y表示该序列点相对于前一序列点在x和y方向上的偏移距离;

p1,p2,p3表示三种面部状态的二进制one-hot向量;p1表示该序列点是面部轮廓或五官的起点,p2表示该序列点与前一序列点为相同器官,p3表示该序列点是68个序列点中的最后一个点;

所述步骤S2中训练Seq2Seq VAE模型的方法具体为:

A1、将一幅真实人脸图像中人脸面部的结构特征的正序序列及其反序序列输入到编码器中,得到正序特征向量和反序特征向量并将其连接成最终特征向量h;

A2、将最终特征向量h通过两个全连接层网络分别映射为平均向量μ和标准差向量σ,并采样得到一个使平均向量μ和标准差向量σ服从正态分布的随机向量z;

A3、将随机向量z输入到解码器中,得到初步训练的Seq2Seq VAE网络;

A4、依次将若干幅真实人脸图像输入到前一次训练的Seq2Seq VAE网络中,重复步骤A1-A3,直到Seq2Seq VAE网络收敛,得到训练好的Seq2Seq VAE模型;

所述步骤A1中的编码器包括一个双向LSTM网络模块,所述双向LSTM网络模块包括两个层数均为68的LSTM网络;

所述步骤A1具体为:

将一幅真实人脸图像中人脸面部的结构特征的正序序列中的每个数据输入到一个LSTM网络中,得到正序特征向量同时将一幅真实人脸图像中人脸面部的结构特征的反序序列的每个数据输入到另一个LSTM网络中,得到反序特征向量将正序特征向量和反序特征向量连接成最终特征向量h;

其中,正序序列

反序序列

其中,i=0,1,2...67;

所述步骤A2中;

随机向量z为:

z=μ+σ⊙N(0,1)

其中,⊙表示向量点乘法;

N(0,1)为IID高斯矢量;

所述步骤A3中,所述解码器为一个时间长度为68的LSTM网络;

所述LSTM网络每一时刻输入元素还包括从前一时刻得到的向量Tt和源点St

所述LSTM网络每一时刻均输出向量Ot,且当前时刻t的输出向量Ot通过高斯混合模型采样得到向量Tt,并输入到下一时刻的LSTM网络;

其中,t表示时刻,t=0,1,2...67;

初始时刻输入到LSTM网络中的向量T0和源点S0均初始化为(0,0,1,0,0)。

2.根据权利要求1所述的基于神经网络的肖像漫画生成方法,其特征在于,当前时刻t的输出向量Ot通过高斯混合模型采样得到向量Tt的方法具体为:

B1、确定高斯混合模型中正态分布的数量N,将输出向量Ot的维度设置为6N,将Ot分解为:

其中,n表示第n个高斯混合模型;

x表示横坐标;

y表示纵坐标;

wn表示第n个高斯混合模型的权重矩阵,且

μ(x,n)表示横坐标x的期望;

μ(y,n)表示纵坐标y的期望;

σ(x,n)表示横坐标x的标准差;

σ(y,n)表示纵坐标y的标准差;

ρ(xy,n)表示相关系数;

B2、确定分解后的Ot输入到高斯混合模型时,采样得到Tt的概率p(x,y;t);

其中,概率p(x,y;t)为:

其中,w(n,t)表示t时刻的第n个高斯混合模型的权重矩阵;

N(x,y)表示坐标(x,y)服从正态分布,参数为μ,σ,ρ;

μ(x,n,t)表示t时刻第n个高斯模型横坐标的期望;

μ(y,n,t)表示t时刻第n个高斯模型纵坐标的期望;

σ(x,n,t)表示t时刻第n个高斯模型横坐标的标准差;

σ(y,n,t)表示t时刻第n个高斯模型纵坐标的标准差;

ρ(xy,n,t)表示相关系数;

B3、将概率p(x,y;t)带入重构误差函数中,得到重构误差,最大化重构误差使高斯混合模型输出目标向量Tt

其中,重构误差函数为:

其中,LR为重构误差;

(x,y)表示特征点的横纵坐标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811631295.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top