[发明专利]一种基于可逆流网络的无监督动作风格迁移方法在审
申请号: | 202111415623.1 | 申请日: | 2021-11-25 |
公开(公告)号: | CN113947525A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 高成英;黄悦 | 申请(专利权)人: | 中山大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T13/40;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逆流 网络 监督 动作 风格 迁移 方法 | ||
1.一种基于可逆流网络的无监督动作风格迁移方法,其特征在于:所述的方法包括步骤如下:
S1:获取BVH格式的动作数据并进行预处理,将预处理后的动作数据作为训练样本;所述的动作数据包括内容动作、风格动作;
S2:构建动作风格迁移模型,所述的动作风格迁移模型包括用于编码动作隐藏特征的投影流网络、用于隐藏特征风格迁移的自适应实例归一化层;
S3:采用训练样本训练动作风格迁移模型,在每一轮训练中利用损失函数对动作风格迁移模型参数进行调整;
S4:将待迁移的动作数据输入训练好的动作风格迁移模型,实现进行任意两个动作的风格迁移。
2.根据权利要求1所述的基于可逆流网络的无监督动作风格迁移方法,其特征在于:步骤S1,对动作数据进行预处理,具体如下:
S101:将BVH格式的动作数据转换为四元数形式x和坐标形式xpos,并以32帧的长度进行片段切割;
S102:分别对四元数形式x、坐标形式xpos的数据进行归一化。
3.根据权利要求1所述的基于可逆流网络的无监督动作风格迁移方法,其特征在于:步骤S2,所述的投影流网络采用16个流结构叠加组成,其中每一个流包括三部分:激活层、可逆1×1卷积层和仿射耦合层;
所述的激活层让每个通道具有零均值和单位方差;
所述的可逆1×1卷积层用于对特征图的通道维度进行置换;
所述的仿射耦合层使用仿射耦合对每个通道数据进行变换。
4.根据权利要求3所述的基于可逆流网络的无监督动作风格迁移方法,其特征在于:所述的仿射耦合层使用仿射耦合对数据进行变换,具体如下:
首先使用split()函数将每个通道数据沿通道维度分成两半xa,xb;然后使用仿射参数ψ和δ对其中的一半xb做仿射变换得到zb;最后使用concat()函数沿着通道维度连接xa,zb两个数据;
其中,所述的仿射参数ψ,δ是使用Transformer网络,根据每个通道数据的一半xa和动作数据的坐标形式xpos进行计算得到。
5.根据权利要求1所述的基于可逆流网络的无监督动作风格迁移方法,其特征在于:步骤S2,所述的自适应实例归一化层,用于进行隐藏特征之间的风格迁移;所述的自适应实例归一化的具体计算如下:
其中,zc表示内容动作的隐藏特征,zs表示风格动作的隐藏特征,μ表示均值,σ表示标准差。
6.根据权利要求1所述的基于可逆流网络的无监督动作风格迁移方法,其特征在于:所述的动作风格迁移模型对输入的动作数据进行处理如下:
D1:将内容动作、风格动作输入到投影流网络中,通过前向传播过程分别得到内容动作、风格动作对应的第一隐藏特征;
D2:分别将内容动作、风格动作对应的第一隐藏特征输入自适应实例归一化层,将风格动作的第一隐藏特征映射为两个仿射参数ψ,δ,并以此对内容动作的第一隐藏特征进行自适应实例归一化,最终输出风格化动作的第二隐藏特征;
D3:将风格化动作的第二隐藏特征输入到投影流网络并进行反向传播,从而重构出最终风格迁移后的动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111415623.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手动自锁双保双控智能消防电磁阀
- 下一篇:一种应用于墙体的锚固扣件