[发明专利]语义一致的图像样式转换在审
申请号: | 201880075742.7 | 申请日: | 2018-10-29 |
公开(公告)号: | CN111386536A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | 斯特凡·古维斯;弗雷德里克·伯奇;康斯坦丁诺斯·布斯马利斯;阿梅利·罗耶;凯文·帕特里克·墨菲 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06T11/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;邓聪惠 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 一致 图像 样式 转换 | ||
1.一种方法,包括:
从源域接收输入源域图像;
使用特定于来自所述源域的图像的一个或多个源域低层级编码器神经网络层来处理所述源域图像,以生成所述输入源域图像的低层级表示;
使用在来自所述源域和目标域的图像之间共享的一个或多个高层级编码器神经网络层来处理所述低层级表示,以生成所述输入源域图像的嵌入;
使用在来自所述源域和目标域的图像之间共享的一个或多个高层级解码器神经网络层来处理所述输入源域图像的所述嵌入,以生成所述输入源域图像的特征的高层级特征表示;以及
使用特定于从所述目标域生成图像的一个或多个目标域低层级解码器神经网络层来处理所述输入源域图像的特征的所述高层级特征表示,以生成来自所述目标域但具有与所述输入源域图像类似的语义的输出目标域图像。
2.根据权利要求1所述的方法,进一步包括:
从目标域接收输入目标域图像;
使用特定于来自所述目标域的图像的一个或多个目标域低层级编码器神经网络层来处理所述输入目标域图像,以生成所述输入目标域图像的低层级表示;
使用在来自所述源域和目标域的图像之间共享的所述一个或多个高层级编码器神经网络层来处理所述低层级表示,以生成所述输入目标域图像的嵌入;
使用在来自所述源域和目标域的图像之间共享的所述一个或多个高层级解码器神经网络层来处理所述输入目标域图像的所述嵌入,以生成所述输入目标域图像的特征的高层级特征表示;以及
使用特定于从所述源域生成图像的一个或多个源域低层级解码器神经网络层来处理所述目标源域图像的特征的所述高层级特征表示,以生成来自所述源域但是具有与所述输入目标域图像类似的语义的输出源域图像。
3.根据权利要求1或2中的任一项所述的方法,其中,所述源域低层级编码器神经网络层、所述高层级编码器神经网络层、所述高层级解码器神经网络层和所述目标域低层级解码器神经网络层已经与一个或多个目标域低层级编码器神经网络层和一个或多个源域低层级解码器神经网络层联合地被训练。
4.根据权利要求2或3中的任一项所述的方法,其中,所述源域低层级编码器神经网络层具有与所述目标域低层级编码器神经网络层相同的架构但是不同的参数值。
5.根据权利要求2至4中的任一项所述的方法,其中,所述源域低层级解码器神经网络层具有与所述目标域低层级解码器神经网络层相同的架构但是不同的参数值。
6.一种训练权利要求2至5中的任一项所述的源域低层级编码器神经网络层、高层级编码器神经网络层、高层级解码器神经网络层、目标域低层级解码器神经网络层、目标域低层级编码器神经网络层和源域低层级编码器神经网络层的方法,所述方法包括:
从所述源域接收训练输入源域图像;
使用所述源域低层级编码器神经网络层来处理所述训练输入源域图像,以生成所述训练输入源域图像的低层级表示;
使用所述高层级编码器神经网络层来处理所述低层级表示,以生成所述训练输入源域图像的嵌入;
使用所述一个或多个高层级解码器神经网络层来处理所述训练输入源域图像的所述嵌入,以生成所述训练输入源域图像的特征的高层级特征表示;以及
使用所述一个或多个目标域低层级解码器神经网络层来处理所述训练输入源域图像的特征的所述高层级特征表示,以生成来自所述目标域的训练输出目标域图像;
使用所述一个或多个目标域低层级编码器神经网络层来处理所述训练输出目标域图像,以生成所述训练输出目标域图像的低层级表示;
使用所述一个或多个高层级编码器神经网络层来处理所述低层级表示,以生成所述训练输出目标域图像的嵌入;
确定减小所述训练输出目标域图像的所述嵌入与所述训练输入源域图像的所述嵌入之间的距离测量的语义一致性损失函数的第一梯度;以及
使用所述第一梯度,更新所述源域低层级编码器神经网络层、所述高层级编码器神经网络层、所述高层级解码器神经网络层、所述目标域低层级解码器神经网络层和所述目标域低层级编码器神经网络层的参数的当前值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880075742.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序