[发明专利]一种基于独特性注意力机制的人体活动识别方法有效
申请号: | 201910570941.1 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110197235B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 郑增威;石利飞;孙霖;陈丹;霍梅梅 | 申请(专利权)人: | 浙江大学城市学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;A61B5/11;A61B5/00 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
地址: | 310015*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 独特性 注意力 机制 人体 活动 识别 方法 | ||
1.一种基于独特性注意力机制的人体活动识别方法,其特征在于,包括如下步骤:
1)、对数据进行预处理;
2)、设计带有独特性注意力机制的LSTM神经网络模型,整个网络分为3个部分:LSTM层、独特性注意力机制层与SOFTMAX全连接层,网络模型的输入为已经过数据预处理的时间序列段,输出为要识别的活动类别;
3)、训练与预测;
步骤2)具体包括如下步骤:
2.1)、使用LSTM层对输入数据进行编码,每个时刻的输入数据都对应输出一个状态向量:LSTM层是带有独特性注意力机制的LSTM神经网络模型的第一层,输入数据为已经过数据预处理的时间序列段,LSTM层输入的数据大小为:(T,F),其中T为输入数据包含的时刻个数,F代表每个时刻采集数据的个数,该层对每个时刻的输入数据输出一个“状态向量”,用ht来表示t时刻的状态向量,用Lh表示“状态向量”的长度,LSTM层的输出的大小为:(T,Lh);
2.2)、使用独特性注意力机制层自动计算由LSTM层输出的每个时刻状态向量的独特性注意力权值,将独特性注意力权值作为独特性注意力机制层的输出,所述独特性注意力机制层是带有独特性注意力机制的LSTM神经网络模型的第二层,如果一个状态向量代表的基本动作独属于某个特定活动的程度高,则带有独特性注意力机制的LSTM神经网络模型对其着重关注;
2.3)、将独特性注意力机制层得到的状态向量H经过SOFTMAX层进行处理,得到长度为C的最终结果向量yp,该向量最大值的下标即为预测的活动类别,此处的SOFTMAX层和独特性注意力机制层用到的SOFTMAX层是同一层,即为带有独特性注意力机制的LSTM神经网络模型的第三层,独特性注意力机制层得到的结果与状态向量的大小完全一样;
步骤2.2)的具体计算方法为:
先使每个状态向量经过一个SOFTMAX全连接层处理,并得到:
probt=softmax(ht)
probt表示当前活动属于任何一个活动类别的可能性,用C表示活动类别个数,则每一个状态向量都输出一个长度为C的结果向量,即probt的长度即为C,使用uniq()计算注意力权值:
attt=uniq(probt)
uniq()的计算方法是将probt向量中最大值减去第二大值的结果作为该状态向量的分数:
scoret=max1(probt)-max2(probt)
该分数表征每个基本动作独属于某个特定活动的程度,如果这种程度越高,则其包含的信息量也越大,每个状态向量都计算得到一个分数,将这些分数进行归一化,得到其注意力权值:
其中T为时间窗口长度,则T个状态向量都计算得到其注意力权值,将所有的状态向量按照其注意力权值进行加权累加得到状态向量H:
2.根据权利要求1所述的一种基于独特性注意力机制的人体活动识别方法,其特征在于,步骤1)具体包括如下步骤:
1.1)、人体活动数据是由大量绑定在人身上的传感器采集来的数据,是一种连续的时间序列数据,而本模型需要的输入是固定长度的,先对原始数据进行切分,设置一个时间窗口,从原始数据中截取特定时间段长度的数据作为训练的输入数据;
1.2)、对数据集里缺失的数据进行插值,并且进行归一化:将数据处理成均值为0,方差为1的数据。
3.根据权利要求1所述的一种基于独特性注意力机制的人体活动识别方法,其特征在于,步骤3)具体包括如下步骤:
3.1)、每个从原始数据中截取的数据段X都对应一个标签y,对标签y进行one-hot编码并得到yr,model()表示带有独特性注意力机制的LSTM神经网络模型,model()将人体活动数据X映射成人体活动的类别标签yp,即:
yp=model(X)
使用交叉熵作为损失函数:
Loss(X,yr)=-yrlog(model(X))=-yrlog(yp);
3.2)、用ADAM作为带有独特性注意力机制的LSTM神经网络模型的优化算法:训练好带有独特性注意力机制的LSTM神经网络模型后,直接将带有独特性注意力机制的LSTM神经网络模型用于预测,对从传感器获取到的数据做和训练时一样的预处理,再输入到带有独特性注意力机制的LSTM神经网络模型,带有独特性注意力机制的LSTM神经网络模型返还一个长度为C的向量,向量最大值的下标即为带有独特性注意力机制的LSTM神经网络模型预测的活动类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学城市学院,未经浙江大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910570941.1/1.html,转载请声明来源钻瓜专利网。