[发明专利]图像的翻译方法和装置、图像翻译模型的训练方法和装置有效
申请号: | 202010484274.8 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111833238B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 杨少雄;赵晨 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 戎郑华 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 翻译 方法 装置 模型 训练 | ||
1.一种图像的翻译方法,包括:
获取图像翻译请求,其中,所述翻译请求中包括原图像;
对所述原图像进行处理,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数;
根据所述变形参数将所述原图像进行变形处理,以获取变形图像;以及
根据所述掩膜图像中各像素点的像素值,确定所述预翻译图像的第一权重及所述变形图像的第二权重,根据所述第一权重及所述第二权重,将所述变形图像中各像素点的像素值和所述预翻译图像中各像素点的像素值进行融合,以生成目标翻译图像;
对所述原图像进行处理,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数,包括:
对所述原图像进行处理,以获取所述原图像中包含的目标对象在第一域的特征;
根据所述目标对象在第一域的特征,重建所述目标对象在第二域的图像,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数,其中,预翻译图像为对原图像直接进行翻译后得到的图像,变形参数为对原图像进行处理时,确定的原图像需要变形的参数信息,即原图像中每个像素点需要平移的距离。
2.如权利要求1所述的方法,其中,所述翻译请求中还包括所述目标翻译图像所属的第一域,在所述获取图像翻译请求之后,还包括:
根据所述目标翻译图像所属的第一域,获取目标生成器;
所述对所述原图像进行处理,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数,包括:
利用所述目标生成器,对所述原图像进行处理,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数。
3. 如权利要求2所述的方法,其中,如果与所述目标翻译图像所属的第一域对应的生成器有N种,N为大于1的整数,则在所述获取图像翻译请求之后,还包括:
对所述原图像进行识别,以确定所述原图像所属的第二域;以及
根据所述原图像所属的第二域及所述目标翻译图像所属的第一域,从所述N种生成器中选取所述目标生成器。
4. 如权利要求1所述的方法,其中,在所述获取图像翻译请求之后,还包括:
对所述原图像进行识别,以确定所述原图像所属的第二域;以及
根据所述原图像所属的第二域,获取目标生成器;
所述对所述原图像进行处理,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数,包括:
利用所述目标生成器,对所述原图像进行处理,以生成与所述原图像对应的预翻译图像、掩膜图像及变形参数。
5. 如权利要求4所述的方法,其中,如果与所述原图像所属的第二域对应的生成器有N种,N为大于1的整数,则在所述获取图像翻译请求之后,还包括:
获取目标翻译图像所属的第一域;以及
根据所述目标翻译图像所属的第一域及所述原图像所属的第二域,从所述N种生成器中选取所述目标生成器。
6.一种图像翻译模型的训练方法,包括:
获取训练样本集,其中,所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集;
利用第一初始生成器对所述第一图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集;
根据所述第一变形参数集,将所述第一图像集中的图像分别进行变形处理,以获取第一变形图像集;
将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集;
将所述第三图像集中的图像及所述第二图像集中的图像,分别输入至第一初始判别器,以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集;以及
根据所述第一概率集及所述第二概率集,对所述第一初始生成器及所述第一初始判别器进行修正,以生成属于第一域的目标生成器,所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像;
其中,预翻译图像为对原图像直接进行翻译后得到的图像,变形参数为对原图像进行处理时,确定的原图像需要变形的参数信息,即原图像中每个像素点需要平移的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010484274.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序