[发明专利]基于视频片段注意力机制与交互关系活动图建模的群组行为识别方法有效

专利信息
申请号: 202010434393.2 申请日: 2020-05-21
公开(公告)号: CN111626171B 公开(公告)日: 2023-05-16
发明(设计)人: 王传旭;孔玮;邓海刚;闫春娟 申请(专利权)人: 青岛科技大学
主分类号: G06V20/52 分类号: G06V20/52;G06V10/764;G06V10/82;G06N3/0464;G06N3/084
代理公司: 青岛汇智海纳知识产权代理有限公司 37335 代理人: 刘晓
地址: 266000 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 视频 片段 注意力 机制 交互 关系 活动 建模 行为 识别 方法
【权利要求书】:

1.基于视频片段注意力机制与交互关系活动图建模的群组行为识别方法,其特征在于,包括以下步骤:

步骤A、基于片段注意力机制提取关键视频片段;

步骤A1、将待识别视频数据等时长分段,并利用稀疏采样策略在每个分段视频中随机抽取一帧代表一个小的片段,然后对每个视频帧进行空间特征提取;

步骤A2、构建片段注意力模型对不同视频帧分配不同权重,并对权重进行迭代优化,实现对关键片段的有效利用;

步骤A3、提取迭代优化后的最高权重对应的关键视频帧,进而得到其所对应的关键视频片段;

步骤B、提取关键视频片段的时空特征;

步骤C、基于卷积关系机制提取上述时空特征中的组群成员活动强度交互关系,所述卷积关系机制是指基于单人和群组活动,通过其学习产生一个活动图,并通过多个阶段、不同类型的卷积操作对活动图进行优化,形成对组群关系的动态描述;

步骤D、融合步骤B提取的时空特征与步骤C提取的交互关系进行群组行为识别。

2.根据权利要求1所述的基于视频片段注意力机制与交互关系活动图建模的群组行为识别方法,其特征在于:所述步骤B中,提取关键视频片段的时空特征时具体采用以下方式:

步骤B1、构建P3D ResNet网络;

(1)P3D ResNet网络中的卷积核为3D卷积核,将3*3*3的卷积核分解成1*3*3的二维空间卷积和3*1*1的一维时间卷积,二维空间卷积用S表示,一维时间卷积用T表示;

(2)设计P3D-A、P3D-B和P3D-C三种块结构:

P3D-A的表示形式为:

(I+T·S)·xt=xt+T(S(xt))=xt+1                   (7)

其中,I表示原始视频图像,xt和xt+1分别表示残差单元在时间t的输入和输出,S(xt)表示对xt进行空间卷积,T(S(xt))表示对S(xt)进行时域卷积;

P3D-B的表示形式为:

(I+S+T)·xt=xt+S(xt)+T(xt)=xt+1              (8)

P3D-C的表示形式为:

(I+S+T·S)·xt=xt+S(xt)+T(S(xt))=xt+1          (9)

(3)将P3D-A、P3D-B和P3D-C三种块结构进行顺次连接组合形成P3D-ResNet网络结构;

步骤B2、提取时空特征:将步骤A3中提取的关键视频片段输入至所构建的P3D ResNet网络中,得到整个关键片段的时空特征向量Fp3d,也称之为初始特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010434393.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top