[发明专利]基于循环时域保持生成的行为预测方法和装置有效
申请号: | 201910123179.2 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109871893B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 鲁继文;周杰;陈磊;段岳圻 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 循环 时域 保持 生成 行为 预测 方法 装置 | ||
1.一种基于循环时域保持生成的行为预测方法,其特征在于,所述方法包括以下步骤:
在获取当前周期的初始人体动作序列后,循环执行人体动作预测过程直至输出下一周期的人体动作序列,其中,所述人体动作预测过程包括:
获取上一次循环过程输出的训练人体动作序列,并将所述训练人体动作序列输入到预设的长度控制器网络输出控制信号,其中,当首次执行所述循环过程时,所述上一次循环过程输出的训练人体动作序列为所述初始人体动作序列;其中,所述长度控制器网络包括动作空间、状态空间以及奖励函数;其中,所述动作空间定义如下:A=[a0,…,at,…an],at∈{0,1},t∈[0,n];其中,at为t时刻的控制信号,0为停止信号,1为生成信号;所述状态空间定义为当前时刻运动生成器网络输出的预测动作拼接在人体动作序列后生成的训练人体动作序列;所述奖励函数定义如下:
其中,τ表示实际的动作分类,ηt表示t时刻的预测动作序列的动作类型分类;
将所述训练人体动作序列输入计算公式得到控制信号;所述计算公式如下:at=φθ(St);其中,at为t时刻的控制信号,St为所述训练人体动作序列,φθ为所述预设的长度控制器网络;
将所述长度控制器网络输出的控制信号和所述训练人体动作序列输入预设的运动生成器网络;其中,设置三个不同的约束条件对所述运动生成器网络进行训练,三个不同的约束为:连续性约束、逻辑约束和距离度量;其中,所述连续性约束如下:
其中,为连续性判别器网络损失函数,M为目标动作序列,Q为所述训练人体动作序列,ζC为连续性判别器网络;
所述逻辑约束如下:
其中,为逻辑判别器网络损失函数,M为所述目标动作序列,Q为所述训练人体动作序列,ζL为逻辑判别器网络;
根据预设的运动生成器网络损失函数对所述运动生成器网络进行训练;所述运动生成器网络损失函数的计算公式如下:
其中,ψ为所述运动生成器网络,Lψ为所述运动生成器网络损失函数,M为所述目标动作序列,Q为所述训练人体动作序列,ξC为连续性判别器网络,Ω(M,Q)表示M与Q的欧式距离,ξL为所述逻辑判别器网络;
若所述控制信号是生成信号,则通过所述运动生成器网络根据所述人体动作序列生成预测动作序列,将所述预测动作序列拼接在所述人体动作序列后生成本次循环过程的训练人体动作序列,并将所述生成的预测动作序列输出至下一个循环过程;
若所述控制信号是停止信号,则控制所述运动生成器网络输出所述训练人体动作序列作为所述下一周期的人体动作序列。
2.如权利要求1所述的行为预测方法,其特征在于,所述人体动作预测过程,还包括:
将所述下一周期的人体动作序列输入动作分类网络,获取目标预测动作。
3.如权利要求1所述的行为预测方法,其特征在于,所述通过运动生成器网络根据人体动作序列生成预测动作序列,将预测动作序列拼接在人体动作序列后生成本次循环过程的训练人体动作序列包括:
将所述训练人体动作序列和所述控制信号输入计算公式得到预测动作序列,其中,所述计算公式为:
其中,ψ为所述运动生成器网络,ψ(X)为将所述训练人体动作序列和所述控制信号输入到预设的运动生成器网络生成预测动作序列,⊕为对所述人体动作序列与所述预测动作序列进行拼接操作,Q为将所述预测动作序列拼接在所述人体动作序列之后,生成训练人体动作序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910123179.2/1.html,转载请声明来源钻瓜专利网。