[发明专利]风格化图像生成方法、装置、计算机设备和存储介质在审
申请号: | 202310015061.4 | 申请日: | 2023-01-05 |
公开(公告)号: | CN116012488A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 马宇航;唐霁霁;张荣升;陈伟杰;章鑫锋;赵增;范长杰;刘柏;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06T11/20 | 分类号: | G06T11/20;G06V10/424;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/048;G06N3/08;G06N3/0475;G06N3/094 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 管婷 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风格 图像 生成 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了风格化图像生成方法、装置、计算机设备和存储介质;本申请实施例获取待处理描述文本、待处理风格文本以及随机噪声图;将所述待处理描述文本以及所述待处理风格文本映射为语义引导特征;根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征;对所述目标图像特征进行解码处理,生成风格化图像。在本申请实施例中,通过待处理描述文本以及待处理风格文本生成语义引导特征,可以融合描述文本以及风格文本的语义,以提升风格化图像的生成效率。在风格化图像的生成过程中,通过语义引导特征对随机噪声图的图像特征进行交叉注意力处理,增强风格化图像的显示效果。
技术领域
本申请涉及图像处理技术领域,具体涉及风格化图像生成方法、装置、计算机设备和存储介质。
背景技术
在图像处理技术领域,在生成图像时,通常都是将描述图像的文本输入图像生成网络进行调节以生成语义相关图像,并通过图像风格迁移生成风格化图像。
然而,在现有的生成图像的过程中,图像内容和图像风格的权重比例不同影响生成的图像效果,因此需要多次、分别调整图像内容和图像风格的权重比例。显然,现有的风格化图像的生成方式,难以同时兼顾图像内容以及图像风格,不仅图像生成效率低,而且图像的显示效果差。
发明内容
本申请实施例提供风格化图像生成方法、装置、计算机设备和存储介质,可以提升风格化图像的生成效率,增强风格化图像的显示效果。
本申请实施例提供一种风格化图像生成方法,包括:获取待处理描述文本、待处理风格文本以及随机噪声图;将所述待处理描述文本以及所述待处理风格文本映射为语义引导特征;根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征;对所述目标图像特征进行解码处理,生成风格化图像。
本申请实施例还提供一种风格化图像生成装置,包括:获取单元,用于获取待处理描述文本、待处理风格文本以及随机噪声图;映射单元,用于将所述待处理描述文本以及所述待处理风格文本映射为语义引导特征;处理单元,用于根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征;解码单元,用于对所述目标图像特征进行解码处理,生成风格化图像。
本申请实施例还提供一种计算机设备,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本申请实施例所提供的任一种风格化图像生成方法中的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种风格化图像生成方法中的步骤。
本申请实施例可以获取待处理描述文本、待处理风格文本以及随机噪声图;将所述待处理描述文本以及所述待处理风格文本映射为语义引导特征;根据所述语义引导特征,对所述随机噪声图的图像特征进行交叉注意力处理,得到目标图像特征;对所述目标图像特征进行解码处理,生成风格化图像。
在本申请中,通过待处理描述文本以及待处理风格文本生成语义引导特征,可以融合描述文本以及风格文本的语义,引导风格化图像的生成过程,以提升风格化图像的生成效率。此外,在风格化图像的生成过程中,通过语义引导特征对随机噪声图的图像特征进行交叉注意力处理,可以基于语义引导特征对图像特征每个部分赋予不同的权重,以引入语义引导特征来引导学习待处理描述文本以及待处理风格文本到图像特征的映射,使得到的图像特征更加准确,增强风格化图像的显示效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的风格化图像生成方法的场景示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310015061.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序