[发明专利]一种基于骨骼点的端到端行人动作识别方法在审
申请号: | 202110887078.X | 申请日: | 2021-08-03 |
公开(公告)号: | CN113743217A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 赵凡;张子行;吴玉;范彩霞 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 许志蛟 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 骨骼 端到端 行人 动作 识别 方法 | ||
1.一种基于骨骼点的端到端行人动作识别方法,其特征在于,具体按照以下步骤实施:
步骤1,获取行人视频集VS={V1,…,Vk,…,VK}和真值标签集Label={L1,…,Lk,…,LK},表示VS中的第k个视频;
Lk={BTk,STk,ATk}为Vk对应的真值标签,其中为Vk中行人的位置真值,表示Vk第i帧行人框在图像中的左上顶点和右下顶点坐标;为Vk中行人的骨骼点位置真值,表示Vk第i帧行人的所有骨骼点位置真值,其中jn表示骨骼点个数;ATk为Vk中行人的动作类别真值,K表示VS中的视频总个数,n表示Vk的帧数;
步骤2,初始化视频个数计数器k=1,视频总个数K,定义行人动作序列集PS=NULL;
步骤3,将Vk、BTk作为输入,调用开源的OPENCV提取感兴趣区域库函数cv2.wrapaffine(),在Vk中提取BTk对应的行人所在图像区域Pk,将Pk追加到行人动作序列集PS中,即PS=PS+Pk;
步骤4,视频个数计数器k=k+1,当k<K,进入步骤3,否则进入步骤5;
步骤5,按个数比例因子rat将PS分为训练样本集PStrain和测试样本集PStest,PStrain和PStest中对应的行人骨骼点位置真值表示为STtrian和STtest,动作类别真值表示为ATtrain和ATtest;
步骤6,设计基于骨骼点的端到端行人动作识别网络结构;
步骤7,定义基于骨骼点的端到端行人动作识别网络的目标损失函数Loss;
步骤8,设置网络模型训练参数,将训练样本集PStrain和对应的真值标签STtrian、ATtrain分别送入设计的基于骨骼点的端到端行人动作识别网络中进行训练,当目标函数Loss收敛或者达到迭代设置次数时,结束网络训练,输出网络模型Model;
步骤9,将测试样本集PStest送入网络模型Model中,预测得到PStest中行人的动作类别ACpred,通过比较测试样本集的预测动作类别ACpred和真值标签ATtest是否一致,计算样本的动作识别准确率,计算所有样本准确率的平均值,得到基于骨骼点的端到端行人动作识别网络在标准数据集上对行人动作识别的准确率。
2.根据权利要求1所述一种基于骨骼点的端到端行人动作识别方法,其特征在于,所述步骤6具体过程为:
基于骨骼点的端到端行人动作识别网络结构包括输入层、骨骼点检测模块Mdec、基于骨骼点的动作识别模块Mrec和输出层,具体结构为:
输入层接收一个大小为F×(W×H×C)的视频单元Om,F为视频帧数,W、H、C分别为视频单元中图像的宽、高和通道数;
骨骼点检测模块包括ResNet-50网络、上采样子模块SMUpSample、热图预测子模块SMheatmap和骨骼点估计子模块SMPoint;
基于骨骼点的动作识别模块包括图卷积网络子模块和动作识别子模块SMrec;
输出层输出视频单元Om的预测动作类别ACpred,其中ACpred大小为1×C,C为动作类别数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110887078.X/1.html,转载请声明来源钻瓜专利网。