[发明专利]人脸图像数据集的扩充方法和装置在审
申请号: | 201911421810.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111160487A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 朱军;周聿浩;石佳欣 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张秀程 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 数据 扩充 方法 装置 | ||
本发明实施例提供一种人脸图像数据集的扩充方法和装置,该方法包括:确定人脸图像数据集和预计扩充图像个数;采用所述人脸图像数据集中的图像训练变分自编码器,确定所述变分自编码器的参数,其中,所述变分自编码器包括编码器和解码器;将期望的图像矢量描述的分布采集预计扩充图像个数的图像矢量描述输入所述解码器,得到预计扩充图像个数的图像;其中,所述变分自编码器的训练过程中需要最小化的目标函数关于变分自编码器的参数的梯度是通过样本基于Stein等式和Nystrom算法得到的。本发明实施例提供的方法和装置,提高了人脸图像数据集的扩充的可靠性。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种人脸图像数据集的扩充方法和装置。
背景技术
随着人工智能领域的飞速发展,越来越多的技术都开始采用机器学习的方法进行大量数据的学习和处理。目前,人脸图像数据集可以用作各种研究,但是通常靠现实中采集自然人的人脸图像的数目受到个人隐私的限制而有限,因此,我们如果需要获得较大样本量的人脸图像数据集可以在已有的人脸图像的基础上再生成更多的人工合成的人脸图像,这个再生过程就是人脸图像数据集的扩充。在人脸图像数据集的扩充的过程中采用机器学习来生成更多的人脸图像,通常需要训练变分自编码器,但是在目前在复杂的变分自编码器的训练过程中难以计算对数概率密度函数梯度。
由于变分自编码器的训练通常只利用对数密度函数的梯度,并且较为容易从相应密度函数中进行采样,因此利用样本直接对所述梯度进行估计是一种方法。直接最小化Fisher散度是一个较为有效的估计对数密度函数梯度的方法,此外还有一部分基于Stein方法的梯度估计。虽然这类方法取得了一定的成功,但大部分现有的算法不能保证所估计的梯度具有梯度场的保守性,这在高维情况下可能会影响估计的准确性,另外的一小部分基于核方法的梯度估计虽然能够保证所估计的梯度的保守性,但其的计算复杂度很高,无法适应高维或样本数庞大的情况。
因此,如何避免基于训练变分自编码器来扩充人脸图像数据集的方法中估计的对数概率密度函数梯度缺乏保守性,无法适应高维或样本数庞大的情况,提高人脸图像数据集扩充的可靠性,仍然是本领域技术人员亟待解决的问题。
发明内容
本发明实施例提供一种人脸图像数据集的扩充方法和装置,用以解决现有的基于训练变分自编码器来扩充人脸图像数据集的方法中估计的对数概率密度函数梯度缺乏保守性,无法适应高维或样本数庞大的情况的问题。
第一方面,本发明实施例提供一种人脸图像数据集的扩充方法,包括:
确定人脸图像数据集和预计扩充图像个数;
采用所述人脸图像数据集中的图像训练变分自编码器,确定所述变分自编码器的参数,其中,所述变分自编码器包括编码器和解码器;
将期望的图像矢量描述的分布采集预计扩充图像个数的图像矢量描述输入所述解码器,得到预计扩充图像个数的图像;
其中,所述变分自编码器的训练过程中需要最小化的目标函数关于变分自编码器的参数的梯度是通过样本基于Stein等式和Nystrom算法得到的。
优选地,该方法中,所述编码器的输入为图像数据,输出为对应于每一幅输入图像的图像矢量描述;
所述解码器的输入为图像矢量描述,输出为对应于每一个输入图像矢量描述的图像。
优选地,该方法中,基于所述人脸图像数据集中的图像训练所述变分自编码器,具体包括:
确定第一训练次数以及每次训练需要的第一图像个数;
每次训练中,采用第一图像个数的图像进行训练,计算需要最小化的目标函数关于待优化的编码器的参数的第一梯度,计算需要最小化的目标函数关于待优化的解码器的参数的第二梯度;
基于所述第一梯度和所述第二梯度,利用随机优化器更新所述编码器的参数和所述解码器的参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421810.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置