[发明专利]图像生成方法、装置、设备及可读存储介质在审
申请号: | 201811424165.6 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109784359A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 尹斯星;檀婧 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 吴会英;刘芳 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码器 生成器 核密度估计 模拟数据 可读存储介质 图像生成 训练图像 解码器 非参数估计 仿真图像 损失函数 特征分布 训练过程 训练数据 噪声变量 仿真性 范数 获知 降维 多样性 图像 保证 | ||
1.一种图像生成方法,其特征在于,包括:
将第一噪声变量输入训练后的生成器中,生成第一模拟数据;
将所述第一模拟数据输入训练后的自编码器的解码器中,生成仿真图像;
其中,所述训练后的生成器以对潜在特征分布和模拟数据分布的核密度估计结果的L1范数作为损失函数;所述潜在特征是利用所述训练后的自编码器的编码器对原始训练图像降维后生成的;所述训练后的自编码器是采用所述原始训练图像进行训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述将第一噪声变量输入训练后的生成器中,生成第一模拟数据之前,还包括:
将原始训练图像输入训练后的自编码器的编码器中,获得所述原始训练图像的潜在特征;
将噪声变量输入生成器模型中,得到模拟数据;
对所述潜在特征进行核密度估计,得到第一估计结果;
对所述模拟数据进行核密度估计,得到第二估计结果;
将所述第一估计结果和第二估计结果的L1范数作为损失函数;
对所述生成器模型进行训练,并在训练中采用所述损失函数对所述生成器模型的参数进行约束;
调整所述生成器模型的参数,若所述损失函数达到最小,则确定所述生成器模型为训练后的生成器。
3.根据权利要求1所述的方法,其特征在于,所述核密度估计表示为:
其中,
代表带宽为H的核函数,带宽H是d维的对称正定矩阵。
4.根据权利要求3所述的方法,其特征在于,所述核函数为高斯核函数;
所述高斯核函数表示为:
其中,带宽H为对角矩阵,对角元素σi是被估计样本第i维的标准差;
将计算概率分布的位置s设定为每一个样本所在的位置。
5.根据权利要求4所述的方法,其特征在于,所述损失函数表示为:
其中,
为对潜在特征分布的核密度估计,
为对模拟数据分布的核密度估计。
6.一种图像生成装置,其特征在于,包括:
生成器模块,用于将第一噪声变量输入训练后的生成器中,生成第一模拟数据;
解码器模块,用于将所述第一模拟数据输入训练后的自编码器的解码器中,生成仿真图像;
其中,所述训练后的生成器以对潜在特征分布和所述模拟数据分布的核密度估计结果的L1范数作为损失函数;所述潜在特征是利用所述训练后的自编码器的编码器对原始训练图像降维后生成的;所述训练后的自编码器是采用所述原始训练图像进行训练得到的。
7.根据权利要求6所述的装置,其特征在于,还包括:
训练模块,用于在所述生成器模块将第一噪声变量输入训练后的生成器中,生成第一模拟数据之前,将原始训练图像输入训练后的自编码器的编码器中,获得所述原始训练图像的潜在特征;将噪声变量输入生成器模型中,得到模拟数据;对所述潜在特征进行核密度估计,得到第一估计结果;对所述模拟数据进行核密度估计,得到第二估计结果;将所述第一估计结果和第二估计结果的L1范数作为损失函数;对所述生成器模型进行训练,并在训练中采用所述损失函数对所述生成器模型的参数进行约束;调整所述生成器模型的参数,若所述损失函数达到最小,则确定所述生成器模型为训练后的生成器。
8.根据权利要求6所述的装置,其特征在于,所述核密度估计表示为:
其中,
代表带宽为H的核函数,带宽H是d维的对称正定矩阵。
9.根据权利要求8所述的装置,其特征在于,所述核函数为高斯核函数;
所述高斯核函数表示为:
其中,带宽H为对角矩阵,对角元素σi是被估计样本第i维的标准差;
将计算概率分布的位置s设定为每一个样本所在的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811424165.6/1.html,转载请声明来源钻瓜专利网。