[发明专利]人脸图像数据集的扩充方法和装置在审

专利信息
申请号: 201911421810.3 申请日: 2019-12-31
公开(公告)号: CN111160487A 公开(公告)日: 2020-05-15
发明(设计)人: 朱军;周聿浩;石佳欣 申请(专利权)人: 清华大学
主分类号: G06K9/62 分类号: G06K9/62;G06N20/00
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 张秀程
地址: 100084 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 数据 扩充 方法 装置
【说明书】:

发明实施例提供一种人脸图像数据集的扩充方法和装置,该方法包括:确定人脸图像数据集和预计扩充图像个数;采用所述人脸图像数据集中的图像训练变分自编码器,确定所述变分自编码器的参数,其中,所述变分自编码器包括编码器和解码器;将期望的图像矢量描述的分布采集预计扩充图像个数的图像矢量描述输入所述解码器,得到预计扩充图像个数的图像;其中,所述变分自编码器的训练过程中需要最小化的目标函数关于变分自编码器的参数的梯度是通过样本基于Stein等式和Nystrom算法得到的。本发明实施例提供的方法和装置,提高了人脸图像数据集的扩充的可靠性。

技术领域

本发明涉及机器学习技术领域,尤其涉及一种人脸图像数据集的扩充方法和装置。

背景技术

随着人工智能领域的飞速发展,越来越多的技术都开始采用机器学习的方法进行大量数据的学习和处理。目前,人脸图像数据集可以用作各种研究,但是通常靠现实中采集自然人的人脸图像的数目受到个人隐私的限制而有限,因此,我们如果需要获得较大样本量的人脸图像数据集可以在已有的人脸图像的基础上再生成更多的人工合成的人脸图像,这个再生过程就是人脸图像数据集的扩充。在人脸图像数据集的扩充的过程中采用机器学习来生成更多的人脸图像,通常需要训练变分自编码器,但是在目前在复杂的变分自编码器的训练过程中难以计算对数概率密度函数梯度。

由于变分自编码器的训练通常只利用对数密度函数的梯度,并且较为容易从相应密度函数中进行采样,因此利用样本直接对所述梯度进行估计是一种方法。直接最小化Fisher散度是一个较为有效的估计对数密度函数梯度的方法,此外还有一部分基于Stein方法的梯度估计。虽然这类方法取得了一定的成功,但大部分现有的算法不能保证所估计的梯度具有梯度场的保守性,这在高维情况下可能会影响估计的准确性,另外的一小部分基于核方法的梯度估计虽然能够保证所估计的梯度的保守性,但其的计算复杂度很高,无法适应高维或样本数庞大的情况。

因此,如何避免基于训练变分自编码器来扩充人脸图像数据集的方法中估计的对数概率密度函数梯度缺乏保守性,无法适应高维或样本数庞大的情况,提高人脸图像数据集扩充的可靠性,仍然是本领域技术人员亟待解决的问题。

发明内容

本发明实施例提供一种人脸图像数据集的扩充方法和装置,用以解决现有的基于训练变分自编码器来扩充人脸图像数据集的方法中估计的对数概率密度函数梯度缺乏保守性,无法适应高维或样本数庞大的情况的问题。

第一方面,本发明实施例提供一种人脸图像数据集的扩充方法,包括:

确定人脸图像数据集和预计扩充图像个数;

采用所述人脸图像数据集中的图像训练变分自编码器,确定所述变分自编码器的参数,其中,所述变分自编码器包括编码器和解码器;

将期望的图像矢量描述的分布采集预计扩充图像个数的图像矢量描述输入所述解码器,得到预计扩充图像个数的图像;

其中,所述变分自编码器的训练过程中需要最小化的目标函数关于变分自编码器的参数的梯度是通过样本基于Stein等式和Nystrom算法得到的。

优选地,该方法中,所述编码器的输入为图像数据,输出为对应于每一幅输入图像的图像矢量描述;

所述解码器的输入为图像矢量描述,输出为对应于每一个输入图像矢量描述的图像。

优选地,该方法中,基于所述人脸图像数据集中的图像训练所述变分自编码器,具体包括:

确定第一训练次数以及每次训练需要的第一图像个数;

每次训练中,采用第一图像个数的图像进行训练,计算需要最小化的目标函数关于待优化的编码器的参数的第一梯度,计算需要最小化的目标函数关于待优化的解码器的参数的第二梯度;

基于所述第一梯度和所述第二梯度,利用随机优化器更新所述编码器的参数和所述解码器的参数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911421810.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top