[发明专利]一种基于卷积神经网络的人体姿态识别方法有效
申请号: | 201910481323.X | 申请日: | 2019-06-04 |
公开(公告)号: | CN110222634B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 李建;张袁;罗颖;张亦昕 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/774;G06V10/82;G06N3/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;杨静 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 人体 姿态 识别 方法 | ||
1.一种基于卷积神经网络的人体姿态识别方法,其特征在于,包括以下步骤:
S01,获取人体姿态视频数据集,对其进行视频切成图像帧的预处理,并将被切成图像帧的图像数据集划分成训练集与验证集;
S02,构建神经网络模型,在RELU激励函数输入处引入稀疏性,卷积神经网络的输入为所述步骤S01中预处理后的图像,输出为人体姿态类别;对所述卷积神经网络进行训练;
S03,采用所述S02中的神经网络模型对人体姿态进行识别,在公开的人体姿态数据集KTH上进行模型训练和性能的测试;当有未知视频输入时,首先调用所述步骤S01进行预处理,然后利用所述步骤S02中的神经网络模型进行姿态识别,获取人体姿态类别;
在所述步骤S02中,在RELU激励函数输入处,即线性滤波器的输出处,引入稀疏性,具体为:
所述卷积神经网络中第k层RELU激励函数的输入hk的稀疏度表示为:
其中,hk是第k层RELU激励函数的输入,S(hk)为卷积神经网络中第k层RELU激励函数的输入hk的稀疏度;
定义优化的目标函数,以确定卷积神经网络参数,目标函数定义如下:
E=L+λ∑kS(hk)
其中,E是优化的目标函数,L是未引入稀疏性的目标函数,也就是目标损失函数,λ是控制稀疏度的调谐参数。
2.根据权利要求1所述的一种基于卷积神经网络的人体姿态识别方法,其特征在于:在所述步骤S01中,获取人体姿态视频数据集具体包括以下步骤:
S11:获取公开的KTH人体姿态视频数据集;
S12:将视频切割成帧,并保存每帧的图像;
S13:从图像中筛选出出现完整人体并作出标签对应姿态的人体行为的图像,删除空白或者未出现完整人体或未作出标签对应姿态的人体行为的图像,并对筛选后的图像进行分类标记;所述标签对应姿态包括拳击、挥手、鼓掌、慢跑、跑、慢走;所述分类标记具体为按照拳击、挥手、鼓掌、慢跑、跑、慢走这6类姿态进行标记;
S14:使用高斯混合模型来提取前景,即运动的人体;
S15:对所述步骤S13中筛选后的图像进行归一化处理;
S16:按8:2的比例将所述步骤S15中归一化处理后的图像集随机分为训练集和验证集。
3.根据权利要求1所述的一种基于卷积神经网络的人体姿态识别方法,其特征在于:在所述步骤S02中,所述卷积神经网络包括4个卷积层、4个池化层、2个全连接层和1个分类层;前两个卷积层中卷积核的大小设置为5×5,后两个设置为3×3;所有池化层的大小设置为2×2,池化层采用最大池化;第一个卷积层中的卷积核数目32个,第二卷积层中的卷积核数目64个,第三和第四个卷积层中的卷积核数目均为128个;第一个全连接层中的神经元数设置为1024个,第二个全连接层中的神经元数量设置为512个;在卷积层和全连接层中,使用RELU函数作为激活函数。
4.根据权利要求3所述的一种基于卷积神经网络的人体姿态识别方法,其特征在于:假设第m层卷积层的第n个节点Om,n的输入值为{xn-1,1;xn-1,2;…;xn-1,k},则输出单元的值如下:
其中,hw,b(x)是激励值,f(x)是激励函数,xi是节点第i个输入值,wi是节点第i个输入值的权重,k是当前节点输入值的个数,b是偏置项;
修正线性单元RELU定义如下:
f(x)=max(0,x)
修正线性单元RELU是卷积层的标准激励函数,为卷积神经网络提供非线性激活能力,并且不会干扰其他卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910481323.X/1.html,转载请声明来源钻瓜专利网。