[发明专利]一种基于高斯混合模型先验变分自编码器的图像生成方法有效

申请号：	202010024870.8	申请日：	2020-01-10
公开（公告）号：	CN111243045B	公开（公告）日：	2023-04-07
发明（设计）人：	郭春生;周家洛;应娜;陈华华;杨萌	申请（专利权）人：	杭州电子科技大学
主分类号：	G06T9/00	分类号：	G06T9/00
代理公司：	浙江千克知识产权代理有限公司 33246	代理人：	周希良
地址：	310018 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于混合模型先验编码器图像生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于高斯混合模型先验变分自编码器的图像生成方法，包括步骤：S11.预设生成图像训练数据集；其中训练数据集由若干批次的训练数据组成；S12.搭建高斯混合模型先验的变分自编码器网络；S13.将预设的若干批次的训练数据上传至变分自编码器网络中，并确定变分自编码器网络的后验分布和先验分布；S14.确定高斯混合模型中高斯分量之间的关系，得到映射函数；S15.利用变分自编码器网络和得到的映射函数得到重构损失函数和KL散度函数，计算变分自编码器网络的后验分布和先验分布的损失函数，并对变分自编码器网络的参数进行更新以生成图像；S16.当生成图像时，将伪输入作为输入图像上传至变分自编码器网络，得到最终生成的图片。

技术领域

本发明涉及深度学习技术领域，尤其涉及一种基于高斯混合模型先验变分自编码器的图像生成方法。

背景技术

在互联网时代，机器学习发展迅速，取得了很大的成就，其中图像生成技术作为机器学习的一个分支，对我们理解图像发挥了重要的作用。图像生成模型是用于对图像进行概率建模的概率模型，而深度神经网络可以看成是一个非常复杂的、拟合能力非常强的非线性函数，可以用于搭建生成模型来估计概率密度函数的参数。图像生成模型可以用于更多不同图片样本的生成，可以用于图像信息的恢复，也可以用于不同模态的图片或者图片与文字、语音等之间的转换，还可以用于预测未来，例如可以根据视频中过去帧和当前帧预测未来帧。

变分自编码器是一种十分著名的基于深度学习的图像生成模型，它是变分推断的自然发展，它结合ELBO和神经网络的优势，解决了通用场景下的推断问题，同时也解决了连续数据的生成问题。它具有很多优势，包括训练快、稳定等，从而在理论模型和工业界上都有广泛的应用。然而，标准的变分自编码器先验由于存在欠拟合问题，往往会生成比较模糊的图片。

发明内容

本发明的目的是针对现有技术的缺陷，提供了一种基于高斯混合模型先验变分自编码器的图像生成方法，可以对复杂图像进行建模，生成高质量图片，这大大提高了模型的生成能力。

为了实现以上目的，本发明采用以下技术方案：

一种基于高斯混合模型先验变分自编码器的图像生成方法，包括步骤：

S1.预设生成图像训练数据集；其中，所述训练数据集由若干批次的训练数据组成；

S2.搭建基于高斯混合模型先验的变分自编码器网络；

S3.将所述预设的若干批次的训练数据上传至搭建的变分自编码器网络中，并确定所述变分自编码器网络的后验分布和先验分布；

S4.确定所述高斯混合模型中高斯分量之间的关系，得到映射函数；

S5.利用所述变分自编码器网络和得到的映射函数得到重构损失函数和KL散度函数，根据所述得到的重构损失函数和KL散度函数计算所述变分自编码器网络的后验分布和先验分布的损失函数，并对所述变分自编码器网络的参数进行更新以生成图像；

S6.当生成图像时，将伪输入作为输入图像上传至所述变分自编码器网络，得到最终生成的图片。

进一步的，所述步骤S2还包括构建变分自编码器网络中隐变量的后验分布。

进一步的，所述步骤S2中搭建的变分自编码器网络中的参数包括网络输入图像尺寸C×H×W、批次大小B，隐变量维数D，隐变量z，高斯混合数量M，伪输入α，伪输入数量K。