[发明专利]一种图像生成模型的训练方法、图像生成方法及装置在审
申请号: | 202310014499.0 | 申请日: | 2023-01-05 |
公开(公告)号: | CN116012883A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 黄星;刘家宏 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06T15/20;G06N3/04;G06N3/08 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 生成 模型 训练 方法 装置 | ||
1.一种图像生成模型的训练方法,其特征在于,包括:
确定至少一个手势的空间信息以及手部特征,其中,一个手势的空间信息用于表征所述手势中包括的至少两个关键点之间的位置关系,所述手部特征用于表征手部的属性信息;
将所述至少一个手势中每个手势的空间信息以及所述每个手势对应的手部特征输入第一图像生成模型,得到与所述至少一个手势对应的目标图像;
基于所述每个手势对应的手部特征、与所述至少一个手势对应的目标图像以及与所述至少一个手势对应的样本图像,对所述第一图像生成模型训练,生成第二图像生成模型。
2.根据权利要求1所述的图像生成模型的训练方法,其特征在于,所述方法还包括:
获取样本数据,所述样本数据包括至少一个样本图像以及所述至少一个样本图像中每一个样本图像中包括的手势的描述信息,其中,一个样本图像中包括的手势的描述信息用于表征所述样本图像中包括的手势的含义,所述至少一个样本图像为与所述至少一个手势对应的样本图像;
当所述样本数据中存在第一手势的描述信息时,对第一样本图像进行编码处理,得到所述第一手势对应的手部特征,所述第一手势为所述至少一个手势中的一个,所述第一样本图像为与所述第一手势对应的样本图像。
3.根据权利要求2所述的图像生成模型的训练方法,其特征在于,所述方法还包括:
当所述样本数据中不存在所述第一手势的描述信息时,将预设手部特征确定为所述第一手势对应的手部特征。
4.根据权利要求1-3中任一项所述的图像生成模型的训练方法,其特征在于,所述确定至少一个手势的空间信息,包括:
基于第一手势的描述信息对所述第一手势进行渲染处理,得到所述第一手势的空间信息,所述第一手势的空间信息包括所述第一手势中包括的至少两个关键点中每个关键点的三维坐标以及所述每个关键点的旋转参数,所述第一手势为所述至少一个手势中的一个。
5.根据权利要求1所述的图像生成模型的训练方法,其特征在于,所述基于所述每个手势对应的手部特征、与所述至少一个手势对应的目标图像以及与所述至少一个手势对应的样本图像,对所述第一图像生成模型训练,生成第二图像生成模型,包括:
确定第一损失,所述第一损失用于表征所述每个手势对应的手部特征的概率分布与预设正态分布之间的不一致程度;
将至少一个目标图像中的每一个目标图像输入初始判别器,得到第一概率,所述第一概率用于表征所述每一个目标图像被判别为第一标签的概率,所述第一标签用于表征样本图像,所述至少一个目标图像为与所述至少一个手势对应的目标图像;
确定第二损失,所述第二损失用于表征至少一个样本图像中每一个样本图像的像素与所述至少一个目标图像的像素之间的不一致程度,所述至少一个样本图像为与所述至少一个手势对应的样本图像;
基于所述第一损失、所述第一概率以及所述第二损失,确定第三损失;
基于所述第三损失,更新所述第一图像生成模型中的参数,生成所述第二图像生成模型。
6.根据权利要求5所述的图像生成模型的训练方法,其特征在于,所述方法还包括:
将所述每一个目标图像输入所述初始判别器,得到第二概率,所述第二概率用于表征所述每一个目标图像被判别为第二标签的概率,所述第二标签用于表征非样本图像;
将所述每一个样本图像输入所述初始判别器,得到第三概率,所述第三概率用于表征所述每一个样本图像被判别为所述第一标签的概率;
基于所述第二概率以及所述第三概率,确定第四损失;
基于所述第四损失,更新所述初始判别器中的参数,生成目标判别器。
7.一种图像生成方法,其特征在于,包括:
确定预设手势的空间信息以及预设手部特征,所述预设手势的空间信息用于表征所述预设手势中包括的至少两个关键点之间的位置关系,所述预设手部特征用于表征手部的属性信息;
将所述预设手势的空间信息以及所述预设手部特征输入第二图像生成模型,得到目标生成图像,所述第二图像生成模型是基于权利要求1-6中任一项所述的图像生成模型的训练方法训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310014499.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序