[发明专利]一种基于时空关联神经网络的动作识别方法及其系统有效

申请号：	201811368191.1	申请日：	2018-11-16
公开（公告）号：	CN109583334B	公开（公告）日：	2022-11-04
发明（设计）人：	胡海峰;刘峥;何琛;张俊轩	申请（专利权）人：	中山大学
主分类号：	G06V40/20	分类号：	G06V40/20;G06V20/40;G06V10/764;G06V10/82;G06N3/04;G06N3/08
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	林丽明
地址：	510260 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于时空关联神经网络动作识别方法及其系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于时空关联神经网络的动作识别方法，通过对海量已标注动作类别的视频数据进行训练得到时空关联神经网络。该网络是由三个部分(空间神经网络模块，相邻帧关联神经网络模块，关联模块)组成的动作识别模型。该发明能够有效的提取到视频动作的空间信息以及动作的时间信息，能够更好地实现视频动作时空信息的提取。设计的时空关联神经网络能够实现端到端的学习，在动作识别的准确率和速度上都有很好的表现。

技术领域

本发明涉及人工智能领域，更具体地，涉及一种基于时空关联神经网络的动作识别方法及其系统。

背景技术

早期的动作识别技术以人工设计特征的方法为主，效果一般。近年来随着深度学习方法在计算机视觉领域中的广泛应用，形成了以神经网络为基础的一系列的动作识别方法，取得了比较大的成功。2014年Smionyan等人提出了双流卷积神经网络，使用光流来代替视频中的时间信息取得了比较大的成功。2016年而Wang等设计了一种时间分段网络，该网络结构通过将视频帧分段，可以进行长时间的建模，能够比较好的获取长时间的动作信息。

虽然双流网络在动作识别中取得了一定的效果，但是该模型使用光流作为运动的时间信息的表征，具有几个问题。一方面光流能否代表运动中的时间信息有待商榷，另一方面光流的计算需要耗费大量的时间，对于监控等实时应用场景，光流无法使用，限制了该方法的时效性。因此该方法无法在实际应用上取得突破。

发明内容

本发明为克服上述现有技术所述的不能满足所有应用场所以及计算比较耗时缺陷，提供一种基于时空关联神经网络的动作识别方法及其系统。

本发明旨在至少在一定程度上解决上述技术问题。

为解决上述技术问题，本发明的技术方案如下：一种基于时空关联神经网络的动作识别方法，其步骤包括：

S1：构造与训练空间神经网络模块；

S2：构造与训练相邻帧关联神经网络模块，使用关联模块连接空间神经网络模块与相邻帧关联神经网络模块；

S3：训练由空间神经网络模块与相邻帧关联神经网络模块复合而成的时空关联神经网络系统；

S4：将待测视频输入到训练好的时空关联神经网络模块中进行动作识别。

本发明通过构造用关联模块来连接空间网络模块与相邻帧关联网模块的时空关联神经网络模块提取出到空间信息与时间信息，从而准确的对待测视频进行动作分类。

优选地，所述步骤S1的具体过程如下：

S1.1：将每个训练视频平均分为3段，每段随机选取一帧，用该三帧视频作为空间神经网络模块的输入，同时采用数据增强处理技术对三帧视频进行处理；