[发明专利]一种基于可变时序的人体行为识别方法在审
申请号: | 202110640902.1 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113361417A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 张鹏超;徐鹏飞;刘亚恒;张智军 | 申请(专利权)人: | 陕西理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 李鹏 |
地址: | 723000 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可变 时序 人体 行为 识别 方法 | ||
1.一种基于可变时序的人体行为识别方法,其特征在于,包括以下步骤:
步骤1,对输入视频进行预处理操作;
步骤2,搭建网络模型SED3DNet;
步骤3,选择合适的损失函数、优化器;
步骤4,训练网络模型,过程如下所示:
步骤4.1,采用Kaiming init的方式初始化参数;
步骤4.2,学习率为0.001,batch_size为16;
步骤4.3,进行损失计算,并利用反向传播机制对权重进行更新;
步骤4.4,训练130个epochs;
步骤4.5,结束训练;
步骤5,进行测试,验证SER3DNet网络的有效性。
2.根据权利要求1所述的一种基于可变时序的人体行为识别方法,其特征在于:步骤1预处理具体子步骤如下:
a:由于视频帧存在大量冗余信息,无法获取视频全局特征信息,故本发明采用二次采样的策略对视频数据集进行采样,以提高行为识别的准确率;首先,按照一定的采样率f(f=4)进行视频采样,获得每个视频对应图像数据集D;然后采用二次采样算法从图像数据集D中均匀采集16帧,形成数据集G;
b:采用随机抖动、水平翻转以及中心裁剪等方法对数据集G进行数据增强,并按照8:2的比例对数据集G进行训练集和测试集的划分,以备网络模型的训练与测试。
3.根据权利要求1所述的一种基于可变时序的人体行为识别方法,其特征在于:所述网络模型SER3Dnet,共18层,6个block。
4.根据权利要求1所述的一种基于可变时序的人体行为识别方法,其特征在于:在步骤3中,采用了交叉熵与正则化L2之和作为网络模型的损失函数:
F=H(P,Q)+L2
其中,交叉熵损失函数H(P,Q)=-P(x)log(Q(x)),主要用于表示真实概率分布P(x)和预测概率分布Q(x)之间的差异性,值越小则表示预测的结果越好;
L2正则化可以有效地防止网络在训练时的过拟合现象,表达式为其中,λ为惩罚因子,n为权重w的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西理工大学,未经陕西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110640902.1/1.html,转载请声明来源钻瓜专利网。