[发明专利]一种训练文本图像生成模型、文本图像生成的方法和装置在审
申请号: | 202110008742.9 | 申请日: | 2021-01-05 |
公开(公告)号: | CN112669215A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 李虎 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 储倩 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 文本 图像 生成 模型 方法 装置 | ||
本申请公开了一种训练文本图像生成模型、文本图像生成的方法和装置,训练文本图像生成模型方法包括:将待训练文本输入文本编码器获得文本向量;利用文本向量和待训练文本的标签图像,训练多级生成式对抗网络获得文本图像生成模型。文本图像生成方法包括:确定待生成图像的目标文本;利用文本编码器处理目标文本获得目标文本向量;将目标文本向量输入上述文本图像生成模型,生成目标文本对应的目标图像。由于文本图像生成模型是多级生成式对抗网络,渐进式学习待训练文本到其标签图像之间的关联,能够生成高分辨率图像;因此,利用该文本图像生成模型处理目标文本对应的目标文本向量,获得的目标文本对应的目标图像分辨率较高。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种训练文本图像生成模型、文本图像生成的方法和装置。
背景技术
随着机器学习的快速发展,一般通过生成式对抗网络生成与文本内容相对应的图像。该生成式对抗网络包括生成网络和判别网络,将文本的特征输入生成式对抗网络,通过生成网络和判别网络互相博弈学习能够产生相当好的图像输出。
但是,发明人经过研究发现,上述生成式对抗网络是一级生成式对抗网络,仅通过一级生成式对抗网络生成文本内容相对应的图像,在生成图像时极其容易产生突变的纹理信息,生成的图像分辨率较低、图像质量较差。
发明内容
有鉴于此,本申请实施例提供一种训练文本图像生成模型、文本图像生成的方法和装置,使得训练获得的文本图像生成模型能够生成高分辨率图像,利用该文本图像生成模型得到的生成图像分辨率较高、图像质量较高。
第一方面,本申请实施例提供了一种训练文本图像生成模型的方法,所述方法包括:
利用文本编码器处理待训练文本获得文本向量;
基于所述文本向量和所述待训练文本的标签图像,训练多级生成式对抗网络获得文本图像生成模型。
可选的,所述基于所述文本向量和所述待训练文本的标签图像,训练多级生成式对抗网络获得文本图像生成模型,包括:
拼接所述文本向量和第一随机向量获得第一个拼接向量;
基于所述第一个拼接向量和所述待训练文本的标签图像,训练第一级生成式对抗网络;
基于所述文本向量和第k-1级生成式对抗网络输出的第k-1个生成图像,获得第k个拼接向量,k为正整数,k≥2;
基于所述第k个拼接向量和所述待训练文本的标签图像,训练第k级生成式对抗网络;
将训练完成的多级生成式对抗网络作为所述文本图像生成模型。
可选的,所述基于所述第一个拼接向量和所述待训练文本的标签图像,训练第一级生成式对抗网络,包括:
利用所述第一级生成式对抗网络中生成网络处理所述第一个拼接向量,生成第一个生成图像;
按照所述第一个生成图像的尺寸对所述待训练文本的标签图像进行采样,获得第一个标签图像;
利用所述第一级生成式对抗网络中判别网络处理所述第一个生成图像和所述第一个标签图像,获得所述第一个生成图像的判别概率和所述第一个标签图像判别概率;
基于所述第一个生成图像的判别概率和所述第一个标签图像判别概率,调整所述第一级生成式对抗网络的网络参数。
可选的,所述基于所述第k个拼接向量和所述待训练文本的标签图像,训练第k级生成式对抗网络,包括:
利用所述第k级生成式对抗网络中生成网络处理所述第k个拼接向量,生成第k个生成图像;
按照所述第k个生成图像的尺寸对所述待训练文本的标签图像进行采样,获得第k个标签图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110008742.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冰箱
- 下一篇:一种对特征加扰数据解扰处理的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序