[发明专利]一种基于生成对抗网络的数据增强方法在审
申请号: | 202110703465.3 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113487715A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 吴郑华;蔡思佳;杨彦韬;顾建军;李特;余小康 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06T15/00 | 分类号: | G06T15/00;G06T17/10;G06T19/20;G06T3/00;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 数据 增强 方法 | ||
1.一种基于生成对抗网络的数据增强方法,其特征在于,包括:首先提取图像特征,编码至特征空间。然后生成3D骨架,将提取的图像特征融合进3D骨架,渲染生成3D框架。接着进行3D框架的视角回归。再利用三维仿射变换,生成新视角的3D框架。进一步将3D框架降维投影成2D图像。最后通过图像修复模型微调得到最终生成的新视角图像。
2.如权利要求1所述基于生成对抗网络的数据增强方法,其特征在于,具体包括以下步骤:
(1)给定待处理的原始图像xori,经过一个卷积层构成的特征提取模块,获取其高阶特征attrori:
attrori=Encoder(xori)
(2)建立3D骨架,其网络层由三维卷积构成,输入为一个可学习的3维张量input,旨在从input里重建出一个正向的3D骨架。把步骤(1)提取的高阶特征attrori融合渲染进3D骨架,形成一个输入图像的3D框架x3D-ori:
x3D-ori=3Dmodel(attrori)
(3)把3D框架x3D-ori输入视角回归模型,进行视角回归任务得到θ1:
θ1=viewregression(x3D-ori)
由于期望最初生成的视角为正向视角(0,90,90),给出一个损失罚项lossoriview:
(4)选定目标新视角θtarget,进行三维仿射变换,生成新视角3D框架x3D-new:
x3D-new=Affine(x3D-ori;θtarget)
同时输入x3D-new到回归模型进行视角回归得到θ2:
θ2=viewregression(x3D-new)
给出新视角的损失罚项lossnewview:
(5)进行新视角的3D转2D投影操作,生成图像xnew:
xnew=Projection(x3D-new)
再接入一个图像修复模型进行生成图像微调,最终生成新视角图像xnewview:
xnewview=Repairmode(xnew)
(6)为了保证其他属性的不变性,把图像xnewview再次输入到步骤(1)的特征提取模块中提取高阶特征attrnewview:
attrnewview=Encoder(xnewview)
给出特征重建损失lossattr:
最终总损失为:
loss=lossoriview+lossnewview+lossattr+lossadversarial
其中,lossadversarial指代生成对抗网络的对抗损失。
3.如权利要求2所述基于生成对抗网络的数据增强方法,其特征在于,步骤(2)中,输入input作为可学习参数,不作为模型正式的输入。
4.如权利要求1所述基于生成对抗网络的数据增强方法,其特征在于,所述3D骨架为一个大致骨架,与提取的图像特征融合后才能形成对应的3D框架,融合方式采用特征拼接或自适应正则化方法等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110703465.3/1.html,转载请声明来源钻瓜专利网。