[发明专利]风格化图像生成方法、装置、计算机设备和存储介质在审
申请号: | 202310015061.4 | 申请日: | 2023-01-05 |
公开(公告)号: | CN116012488A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 马宇航;唐霁霁;张荣升;陈伟杰;章鑫锋;赵增;范长杰;刘柏;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06T11/20 | 分类号: | G06T11/20;G06V10/424;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/048;G06N3/08;G06N3/0475;G06N3/094 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 管婷 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风格 图像 生成 方法 装置 计算机 设备 存储 介质 | ||
1.一种风格化图像生成方法,其特征在于,包括:
获取待处理描述文本、待处理风格文本以及随机噪声图;
将所述待处理描述文本以及所述待处理风格文本映射为语义引导特征;
根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征;
对所述目标图像特征进行解码处理,生成风格化图像。
2.如权利要求1所述的风格化图像生成方法,其特征在于,所述根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征,包括:
获取查询注意力权重、键注意力权重以及值注意力权重,所述键注意力权重以及所述值注意力权重由所述语义引导特征生成,所述查询注意力权重由所述随机噪声图的图像特征生成;
通过所述查询注意力权重、所述键注意力权重以及所述值注意力权重,对所述随机噪声图的图像特征进行权重计算,得到目标图像特征。
3.如权利要求1所述的风格化图像生成方法,其特征在于,所述根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征,包括:
对所述随机噪声图进行下采样处理,得到下采样特征;
根据所述语义引导特征,对所述下采样特征进行上采样处理以及交叉注意力处理,得到目标图像特征。
4.如权利要求3所述的风格化图像生成方法,其特征在于,所述根据所述语义引导特征,对所述下采样特征进行上采样处理以及交叉注意力处理,得到目标图像特征,包括:
对所述下采样特征进行上采样处理,得到上采样特征;
根据所述语义引导特征,对所述下采样特征进行交叉注意力处理,得到中间特征;
对所述中间特征以及所述上采样特征进行组合处理,得到目标图像特征。
5.如权利要求1所述的风格化图像生成方法,其特征在于,所述对所述目标图像特征进行解码处理,生成风格化图像,包括:
获取概率分布参数;
根据所述概率分布参数,对所述目标图像特征进行解码处理,生成风格化图像。
6.如权利要求1所述的风格化图像生成方法,其特征在于,所述获取待处理描述文本、待处理风格文本以及随机噪声图之前,还包括:
获取第一训练集、第二训练集以及待训练的风格化图像生成模型,所述第一训练集包括第一图像数据和所述第一图像数据对应的训练用描述文本,所述第二训练集包括第二图像数据和所述第二图像数据对应的训练用风格文本,所述训练用风格文本包括所述待处理风格文本;
由所述第一图像数据以及所述训练用描述文本,训练所述待训练的风格化图像生成模型,得到中间风格化图像生成模型;
由所述第二图像数据以及所述训练用风格文本,训练所述中间风格化图像生成模型,得到训练后的风格化图像生成模型,所述训练后的风格化图像生成模型用于生成所述风格化图像。
7.如权利要求6所述的风格化图像生成方法,其特征在于,所述待训练的风格化图像生成模型包括第一编码网络、加噪网络、第二编码网络、降噪网络以及解码网络,所述由所述第一图像数据以及所述训练用描述文本,训练所述待训练的风格化图像生成模型,得到中间风格化图像生成模型,包括:
通过所述第一编码网络,对所述第一图像数据进行编码处理,得到第一图像特征;
通过所述加噪网络,对所述第一图像特征加入随机噪声,得到第二图像特征;
通过所述第二编码网络,将所述训练用描述文本映射为第一语义引导特征;
通过所述降噪网络,根据所述第一语义引导特征,对所述第二图像特征进行交叉注意力处理,得到第三图像特征;
通过所述解码网络,对所述第三图像特征进行解码处理,生成第一风格化图像;
通过所述解码网络,根据所述第一风格化图像以及所述训练用描述文本,得到中间风格化图像生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310015061.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序