[发明专利]人脸图像数据集的扩充方法和装置在审

专利信息
申请号: 201911421810.3 申请日: 2019-12-31
公开(公告)号: CN111160487A 公开(公告)日: 2020-05-15
发明(设计)人: 朱军;周聿浩;石佳欣 申请(专利权)人: 清华大学
主分类号: G06K9/62 分类号: G06K9/62;G06N20/00
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 张秀程
地址: 100084 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 数据 扩充 方法 装置
【权利要求书】:

1.一种人脸图像数据集的扩充方法,其特征在于,包括:

确定人脸图像数据集和预计扩充图像个数;

采用所述人脸图像数据集中的图像训练变分自编码器,确定所述变分自编码器的参数,其中,所述变分自编码器包括编码器和解码器;

将期望的图像矢量描述的分布采集预计扩充图像个数的图像矢量描述输入所述解码器,得到预计扩充图像个数的图像;

其中,所述变分自编码器的训练过程中需要最小化的目标函数关于变分自编码器的参数的梯度是通过样本基于Stein等式和Nystrom算法得到的。

2.根据权利要求1所述的人脸图像数据集的扩充方法,其特征在于,

所述编码器的输入为图像数据,输出为对应于每一幅输入图像的图像矢量描述;

所述解码器的输入为图像矢量描述,输出为对应于每一个输入图像矢量描述的图像。

3.根据权利要求2所述的人脸图像数据集的扩充方法,其特征在于,采用所述人脸图像数据集中的图像训练变分自编码器,具体包括:

确定第一训练次数以及每次训练需要的第一图像个数;

每次训练中,采用第一图像个数的图像进行训练,计算需要最小化的目标函数关于待优化的编码器的参数的第一梯度,计算需要最小化的目标函数关于待优化的解码器的参数的第二梯度;

基于所述第一梯度和所述第二梯度,利用随机优化器更新所述编码器的参数和所述解码器的参数;

经过第一训练次数的训练后,确定所述编码器的参数和所述解码器的参数。

4.根据权利要求3所述的人脸图像数据集的扩充方法,其特征在于,所述需要最小化的目标函数为:

Epx(x)Eq(z|x)[|x-G(z)|2]+λ·KL(q(z),p(z))

其中,z为编码器输出的图像描述矢量,x为输入的编码器的图像数据,p(z)为期望的图像描述矢量的分布,q(z)为编码器输出的图像描述矢量的分布,q(z|x)是编码器决定的图像描述矢量近似后验分布,λ为正则化系数,KL(q(z),p(z))表示期望的图像描述矢量的分布p(z)和编码器输出的图像描述矢量的分布q(z)之间的Kullback-Leibler散度,G(z)表示解码器的输出图像;

所述第一梯度为:

其中,φ是编码器的参数,Gφ是通过反向传播技术计算的函数关于φ的梯度,M是每次训练中输入的图像的个数,xm是输入编码器的图像数据,每次训练输入编码器的图像数据为x1,…,xM,ym是解码器输出的对应于xm的图像数据,zm是编码器输出的对应于xm的图像描述矢量,λ为正则化系数,q(zm)为期望的图像描述矢量的分布,为利用标准反向传播技术计算的梯度;

所述第二梯度为Gθ,θ是解码器的参数,所述第二梯度是通过反向传播技术计算的函数关于θ的梯度,M是每次训练中输入的图像的个数,xm是输入编码器的图像数据,每次训练输入编码器的图像数据为x1,…,xM,ym是解码器输出的对应于xm的图像数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911421810.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top