[发明专利]一种基于递归神经网络的群体动作识别方法有效
申请号: | 201810971833.0 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109446872B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 舒祥波;严锐;唐金辉 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/82;G06V10/80;G06V10/764;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 朱宝庆 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种群体动作识别方法,包括以下步骤:在每一时刻,提取个体的CNN特征,作为其静态特征表示;利用一个长短期记忆模型从个体的静态表示中对个体动态进行建模;对Long Motion的建模;对个体间交互动态的建模;对Flash Motion的建模。 | ||
搜索关键词: | 一种 基于 递归 神经网络 群体 动作 识别 方法 | ||
【主权项】:
1.一种基于矩形框坐标变换的多方向文本行检测方法,其特征在于,包括以下步骤:步骤1,输入待检测的视频片段,取其中间T帧,并检测每帧中所有运动个体;步骤2,在每一个时刻,用卷积神经网络提取所有运动个体的空间特征;步骤3,建立Single‑Person LSTM模型,将个体空间特征提供给Single‑Person LSTM模型以捕捉个体时间动态特征;步骤4,根据个体在整个活动过程中移动时间的顺序,将所有个体的时空特征输送到Interaction Bi‑LSTM中以捕获上下文信息;步骤5,将Interaction Bi‑LSTM中的所有隐藏状态赋以动态权值,最终集成至一个Aggregation LSTM中,并将多组的聚合状态连接成对应时刻softmax层的输入;步骤6,对所有时刻下的softmax分数取平均值作为群体活动识别的最终预测概率向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810971833.0/,转载请声明来源钻瓜专利网。