[发明专利]一种基于多尺度特征神经网络的人体行为识别方法在审
申请号: | 202110471890.4 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113343760A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 王永雄;秦宇龙;刘智华 | 申请(专利权)人: | 暖屋信息科技(苏州)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张俊范 |
地址: | 215500 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 特征 神经网络 人体 行为 识别 方法 | ||
1.一种基于多尺度特征神经网络的人体行为识别方法,其特征在于,包括以下步骤:
步骤1、对视频数据进行包括逐帧拆解及归一化的预处理操作,获得包含时序信息的连续视频帧;
步骤2、将样本视频数据经过步骤1的所述预处理操作后添加对应的动作标签构成训练样本;
步骤3、构建多尺度特征神经网络,所述多尺度特征神经网络依次包括第一2+1D卷积层、池化层、四组多尺度特征模块和全局平均池化层,由所述全局平均池化层输出提取的时空特征,由所述时空特征计算对应的动作概率;所述多尺度特征模块包括依次连接的第一卷积层、类残差结构、第二卷积层和第三卷积层,所述类残差结构包括通道数均分的第一分支、第二分支、第三分支和第四分支,所述第二分支、第三分支和第四分支分别设有第四卷积层,所述第一分支的输入特征直接输出,所述第二分支的输出与所述第三分支的输入叠加输入至所述第三分支的第四卷积层,所述第三分支的输出与所述第四分支的输入叠加输入至所述第四分支的第四卷积层,所述第一分支、第二分支、第三分支和第四分支的输出叠加输入至所述第二卷积层;所述多尺度特征模块的输入与所述第三卷积层的输入叠加作为所述多尺度特征模块的输出;
步骤4、由所述训练样本训练所述多尺度特征神经网络;
步骤5、对于待识别的视频数据按所述步骤1得到相应的连续视频帧并输入由所述步骤4训练完成的所述多尺度特征神经网络得到识别结果。
2.根据权利要求1所述的基于多尺度特征神经网络的人体行为识别方法,其特征在于,所述步骤2对所述样本视频数据按步骤1预处理包括对所述样本视频数据按时间维度逐帧拆解,拆解后连续的视频帧,以16帧为一组进行数据增强操作再进行归一化。
3.根据权利要求2所述的基于多尺度特征神经网络的人体行为识别方法,其特征在于,所述数据增强操作包括等比例缩放、随机裁剪和随机水平翻转。
4.根据权利要求1所述的基于多尺度特征神经网络的人体行为识别方法,其特征在于,所述第一卷积层和所述第二卷积层的卷积核为1×1×1,所述第三卷积层和所述第四卷积层的卷积核为3×3×3。
5.根据权利要求1所述的基于多尺度特征神经网络的人体行为识别方法,其特征在于,所述四组多尺度特征模块的通道数依次为64、128、256和512。
6.根据权利要求1所述的基于多尺度特征神经网络的人体行为识别方法,其特征在于,所述多尺度特征神经网络的目标函数为交叉熵函数,所述多尺度特征神经网络的反向传播算法为梯度随机下降算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暖屋信息科技(苏州)有限公司,未经暖屋信息科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110471890.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家具制造用鼓式削片机
- 下一篇:一种晾胶隔离设备及胶片冷却隔离方法