[发明专利]一种训练文本图像生成模型、文本图像生成的方法和装置在审
申请号: | 202110008742.9 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112669215A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 李虎 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 储倩 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 文本 图像 生成 模型 方法 装置 | ||
1.一种训练文本图像生成模型的方法,其特征在于,包括:
利用文本编码器处理待训练文本获得文本向量;
基于所述文本向量和所述待训练文本的标签图像,训练多级生成式对抗网络获得文本图像生成模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本向量和所述待训练文本的标签图像,训练多级生成式对抗网络获得文本图像生成模型,包括:
拼接所述文本向量和第一随机向量获得第一个拼接向量;
基于所述第一个拼接向量和所述待训练文本的标签图像,训练第一级生成式对抗网络;
基于所述文本向量和第k-1级生成式对抗网络输出的第k-1个生成图像,获得第k个拼接向量,k为正整数,k≥2;
基于所述第k个拼接向量和所述待训练文本的标签图像,训练第k级生成式对抗网络;
将训练完成的多级生成式对抗网络作为所述文本图像生成模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一个拼接向量和所述待训练文本的标签图像,训练第一级生成式对抗网络,包括:
利用所述第一级生成式对抗网络中生成网络处理所述第一个拼接向量,生成第一个生成图像;
按照所述第一个生成图像的尺寸对所述待训练文本的标签图像进行采样,获得第一个标签图像;
利用所述第一级生成式对抗网络中判别网络处理所述第一个生成图像和所述第一个标签图像,获得所述第一个生成图像的判别概率和所述第一个标签图像判别概率;
基于所述第一个生成图像的判别概率和所述第一个标签图像判别概率,调整所述第一级生成式对抗网络的网络参数。
4.根据权利要求2所述的方法,其特征在于,所述基于所述第k个拼接向量和所述待训练文本的标签图像,训练第k级生成式对抗网络,包括:
利用所述第k级生成式对抗网络中生成网络处理所述第k个拼接向量,生成第k个生成图像;
按照所述第k个生成图像的尺寸对所述待训练文本的标签图像进行采样,获得第k个标签图像;
利用所述第k级生成式对抗网络中判别网络处理所述第k个生成图像和所述第k个标签图像,获得所述第k个生成图像的判别概率和所述第k个标签图像判别概率;
基于所述第k个生成图像的判别概率和所述第k个标签图像判别概率,调整所述第k级生成式对抗网络的网络参数。
5.根据权利要求2所述的方法,其特征在于,所述基于所述文本向量和第k-1级生成式对抗网络输出的第k-1个生成图像,获得第k个拼接向量,包括:
利用图像编码器处理所述第k-1个生成图像获得第k-1个图像向量;
拼接所述文本向量和所述第k-1个图像向量获得第k个拼接向量。
6.根据权利要求1所述的方法,其特征在于,所述利用文本编码器处理待训练文本获得文本向量,包括:
利用所述文本编码器的嵌入层处理所述待训练文本获得文本嵌入向量;
利用所述文本编码器的全连接层压缩所述文本嵌入向量获得所述文本向量。
7.根据权利要求1所述的方法,其特征在于,所述训练完成条件为所述多级生成式对抗网络收敛;或,所述训练完成条件为所述多级生成式对抗网络的训练迭代次数大于等于预设训练迭代次数。
8.一种文本图像生成的方法,其特征在于,包括:
确定待生成图像的目标文本;
利用文本编码器处理所述目标文本获得目标文本向量;
将所述目标文本向量输入文本图像生成模型,生成所述目标文本对应的目标图像;
其中,所述文本图像生成模型为权利要求1-7任一项所述的文本图像生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110008742.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:冰箱
- 下一篇:一种对特征加扰数据解扰处理的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序