[发明专利]一种基于改进的LSTM模型在人体行为识别上的应用方法在审
申请号: | 202010776882.6 | 申请日: | 2020-08-05 |
公开(公告)号: | CN111860460A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 卢新彪;徐嘉雯 | 申请(专利权)人: | 江苏新安电器股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 张励 |
地址: | 215000 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 lstm 模型 人体 行为 识别 应用 方法 | ||
本发明公开了一种基于改进的LSTM模型在人体行为识别上的应用方法,包括以下步骤:S1:确定网络隐藏层数及其内部神经元数量;S2:若加深网络层数,则在隐藏层间加入Dropout正则项;S3:改变LSTM单元的内置激活函数,将原来的Tanh函数替换为Softsign函数;S4:改变LSTM内部网络,加入正向与反向LSTM单元形成双向LSTM(Bi‑LSTM)单元;S5:记录改进前后的网络训练时间。本发明,由于加深网络层数,引入Dropout以缓解训练集与测试集之间的过拟合情况;Softsign激活函数替换原LSTM默认函数Tanh,一定程度上提高网络精度,降低损失;引入Bi‑LSTM,在CPU上的训练时间从23分钟减小至8分钟,有效缩短网络训练时间。
技术领域
本发明涉及神经网络相关技术领域,具体是一种基于改进的LSTM模型在人体行为识别上的应用方法。
背景技术
人体行为识别是目前计算机视觉领域的一个研究热点,在人机交互、安全防范、多媒体视频理解以及智能家居等方面有着广泛的应用。人体行为识别主要是从视频或传感器采集的数据中判别人体的行为动作并分类。21世纪以来,神经网络技术的发展愈加成熟,其强大的学习能力使得人类的生活生产方式变得更加智能,这也引发了深度学习与神经网络的研究热潮。常用的基于神经网络的人体行为识别模型包括:基于卷积神经网络(Convolutional Neural Network)的行为特征提取,基于长短期记忆网络(LSTM)的行为识别与分类,基于CNN-LSTM的人体行为识别以及CNN-LSTM思想的进一步扩展——ConvLSTM模型。
在实际的神经网络识别人体行为的应用中,给定一个网络模型,需要根据数据集的大小调整内部结构与参数。调试神经网络也是一项很艰巨的任务。例如,当所用数据集较大达到几G 甚至10几G时,我们需要设定较为复杂的网络层或者更多的迭代次数去学习。当然,网络的层数都是由简单到复杂,首先创建一个小的神经网络进行尝试,然后逐步加深,逐步训练解决问题的模型。
1982年,美国加州理工学院物理学家John hopfield发明了一种单层反馈神经网络Hopfield network,用来解决组合优化问题。这是最早的RNN的雏形。随着后期RNN的发展,出现了梯度消失(gradient vanishing)及梯度爆炸(gradient exploding)的问题,训练变得困难,应用非常受限。直到1997 年,人工智能研究所的主任Jurgen Schmidhuber提出长短期记忆(LSTM),LSTM使用门控单元及记忆机制大大缓解了早期 RNN训练的问题。同时期,Mike Schuster提出双向RNN模型 (Bidirectional RNN)。
对于LSTM在手机传感器数据中的应用,许多研究学者已经做了很多较好的实验与成果。例如:于涛(基于智能手机的人体行为识别研究[D].南京邮电大学,2019.)在他的实验中研究了不同网络层数下LSTM网络中样本时序长度和时间复杂度的关系,且提出一种多层并行LSTM网络进行行为识别,使用多个 LSTM单元并行处理一个长时间序列样本的方式,在保证网络特性和算法准确率的同时,降低了样本处理的时间复杂度。但是如果所用数据集不够大,复杂多层的网络结构并不完全适用。在上述实验中,虽然该算法在能量节省率上的表现较好,但是精度发生了略微下降,且有极大可能产生样本的过拟合。
发明内容
本发明的目的在于提供一种基于改进的LSTM模型在人体行为识别上的应用方法,以解决现有技术中的问题。
为实现上述目的,本发明提供如下技术方案:一种基于改进的LSTM模型在人体行为识别上的应用方法,包括以下步骤:
S1:确定网络隐藏层数及其内部神经元数量;
S2:若加深网络层数,则在隐藏层间加入Dropout正则项;
S3:改变LSTM单元的内置激活函数,将原来的Tanh函数替换为Softsign函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏新安电器股份有限公司,未经江苏新安电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010776882.6/2.html,转载请声明来源钻瓜专利网。