[发明专利]一种动作识别模型的训练及动作识别方法与相关装置在审
申请号: | 202110056978.X | 申请日: | 2021-01-15 |
公开(公告)号: | CN112749666A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 蔡祎俊;卢江虎;项伟 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 新加坡巴西班让路*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 动作 识别 模型 训练 方法 相关 装置 | ||
1.一种动作识别方法,其特征在于,包括:
接收视频数据,所述视频数据中具有多帧原始图像数据;
从所述原始图像数据中进行采样,获得目标图像数据;
根据所述目标图像数据在全局的特征识别在所述视频数据中出现的动作,获得全局动作;
根据所述目标图像数据在局部的特征识别在所述视频数据中出现的动作,获得局部动作;
将所述全局动作与所述局部动作融合为在所述视频数据中出现的目标动作。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标图像数据在全局的特征识别在所述视频数据中出现的动作,获得全局动作,包括:
对所述目标图像数据提取二维下的特征,获得全局空间特征;
对所述目标图像数据提取三维下的特征,获得全局时序特征;
将所述全局空间特征与所述全局时序特征拼接为全局目标特征;
将所述全局目标特征映射为预设的动作,获得在所述视频数据中出现的全局动作。
3.根据权利要求2所述的方法,其特征在于,所述提取全局空间特征时按照顺序划分为多个二维阶段,在每个所述二维阶段中依次设置有二维投影块、多个二维残差块;
所述对所述目标图像数据提取二维下的特征,获得全局空间特征,包括:
在当前所述二维阶段中,调用所述二维投影块对所述目标图像数据执行二维卷积操作,依次调用多个所述二维残差块对所述目标图像数据执行二维卷积操作;
判断是否已遍历所有所述二维阶段网络;
若是,则将所述目标图像数据输出为全局空间特征;
若是,则将所述目标图像数据输出至下一个所述二维阶段网络,返回执行在当前所述二维阶段中,调用所述二维投影块对所述目标图像数据执行二维卷积操作,依次调用多个所述二维残差块对所述目标图像数据执行二维卷积操作。
4.根据权利要求3所述的方法,其特征在于,
所述二维投影块设置有第一二维卷积层、多个第二二维卷积层;
所述调用所述二维投影块对所述目标图像数据执行二维卷积操作,包括:
调用所述第一二维卷积层对所述目标图像数据执行二维卷积操作;
依次调用多个所述第二卷积层对所述目标图像数据执行二维卷积操作;
对所述第一二维卷积层输出的目标图像数据与所述第二二维卷积层输出的目标图像数据进行合并;
所述二维残差块设置有多个第三二维卷积层;
所述依次调用多个所述二维残差块对所述目标图像数据执行二维卷积操作,包括:
在每个所述二维残差块中,依次调用多个所述第三二维卷积层对所述目标图像数据执行二维卷积操作。
5.根据权利要求2所述的方法,其特征在于,所述提取全局时序特征时按照顺序划分为多个三维阶段,第一个所述三阶段中设置一个或多个三维残差块,其他所述三维阶段中依次设置有三维投影块、一个或多个三维残差块;
所述对所述目标图像数据提取三维下的特征,获得全局时序特征,包括:
在当前所述三维阶段中,调用所述三维投影块对所述目标图像数据执行三维卷积操作,和/或,调用所述三维残差块对所述目标图像数据执行三维卷积操作;
判断是否已遍历所有所述三维阶段;
若是,则将所述目标图像数据输出为全局时序特征;
若是,则将所述目标图像数据输出至下一个所述三维阶段网络,返回执行在当前所述三维阶段中,调用所述三维投影块对所述目标图像数据执行三维卷积操作,和/或,依次调用多个所述三维残差块对所述目标图像数据执行三维卷积操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110056978.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗蠕变防紫外线木塑材料
- 下一篇:三维重建方法及相关装置、设备