[发明专利]多对象场景无接触交互检测方法在审

专利信息
申请号: 202210861781.8 申请日: 2022-07-22
公开(公告)号: CN115880601A 公开(公告)日: 2023-03-31
发明(设计)人: 王松;李嘉诚;韩瑞泽;冯伟;王松淼 申请(专利权)人: 天津大学
主分类号: G06V20/40 分类号: G06V20/40;G06V10/77;G06V10/82;G06V10/80;G06V40/20;G06N3/0464;G06N3/047;G06N3/044;G06N3/082
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对象 场景 接触 交互 检测 方法
【权利要求书】:

1.一种多对象场景无接触交互检测方法,其特征是,利用关系对嵌入网络PRE-Net,通过聚合场景中的个体以及群体信息、短期以及长期信息得到关系对,通过计算交互关系矩阵、计算个体交互类别向量、计算全局交互类别向量,从而进行交互预测和识别。

2.如权利要求1所述的多对象场景无接触交互检测方法,其特征是,具体步骤如下:

步骤S1:个体信息提取

(a)短期视频段分割

对于一输入视频序列,将其分割成K个等长的视频片段,对每个视频片段进行较短间隔的采样,得到个N视频帧,对于具有K个片段的视频序列,最终得到K×N个视频帧;

(b)空间信息提取

对于第t帧的第i个个体,将其2D位置向量表示为:

计算运动方向向量

在视频段中的N个视频帧中使用单层GRU整合相同个体的位置信息,对于帧t上的个体i计算其位置信息

最终得到每个个体的空间特征

(c)外观特征提取

使用非对称卷积网络Inception-v3在每个边界框内提取多尺度的特征信息,使用感兴趣区域特征提取RoIAlign将提取的特征调整为相同大小,使用核尺寸为3×1×1的多个3D卷积层聚合时间信息,最终使用全连接层得到每个个体的外观体征

步骤S2:个体对关系立方体计算

(a)关系图节点表示

通过连接外观体征与空间特征计算场景中所有M个个体的节点特征向量Fi为:

(b)关系图边表示

计算节点即个体i、j间的边特征Ei,j为:

Ei,j=fc(concat(Fi,Fj)),i,j∈1,2,…,M

将场景中所有个体间M×M个边特征Ei,j合并为个体对关系立方体

(c)长期特征聚合

使用单层双向GRU将视频片段k的关系立方体Ek的短期特征聚合成长期特征Hk

Hk=GRU(Ek,Hk-1)

其中,K为整个视频的片段数;

步骤S3:交互预测

(a)计算交互关系矩阵

将长期特征矩阵Hk使用双层全连接层在通道维度进行压缩,得到矩阵将矩阵fc(H)展平成一维向量vH:/

对向量vH进行softmax函数操作,并转换成原始矩阵的形式,得到交互关系矩阵R:

R=reshape(softmax(vH))

(b)计算个体交互类别向量

对于矩阵Hk,在Y维度逐个取其最大值以进行压缩:

将M输入全连接层,并进行softmax操作得到个体交互类别向量vi

(c)计算全局交互类别向量

对于矩阵Hk,在X,Y维度逐个取其最大值以进行压缩:

将m输入全连接层,并进行softmax操作得到全局交互类别向量g:

进行交互预测和识别。

3.如权利要求1所述的多对象场景无接触交互检测方法,其特征是,详细步骤如下:

步骤1:将输入视频序列分割成等长的视频片段,对每个视频片段进行较短间隔的采样,得到若干视频帧;

步骤2:对于第t帧的第i个个体,使用其2D位置向量计算运动方向向量/在视频段中的各视频帧中使用单层GRU整合相同个体的位置信息/

步骤3:使用非对称卷积网络Inception-v3在每个边界框内提取多尺度的特征信息,将提取的特征用感兴趣区域特征提取RoIAlign调整为相同大小,使用核尺寸为3×1×1的多个3D卷积层聚合时间信息,使用全连接层得到各个体的外观体征

步骤4:连接外观体征与空间特征得到场景中所有M个个体的节点特征向量Fi

步骤5:连接各个体的节点特征向量Fi得到边特征Ei,j,并将其合并为个体对关系立方体E;

步骤6:用单层双向GRU将个体对关系立方体E聚合为长期特征矩阵H;

步骤7:将长期特征矩阵H使用双层全连接层在通道维度进行压缩,并展平成一维向量v。对其进行softmax操作,并转换成原始矩阵的形式,得到交互关系矩阵R;

步骤8:对长期特征矩阵H在Y维度逐个取其最大值进行压缩,将压缩后的矩阵输入全连接层,并进行softmax操作得到个体交互类别向量vi

步骤9:对长期特征矩阵H在X,Y维度逐个取其最大值进行压缩,将压缩后的矩阵输入全连接层,并进行softmax操作得到全局交互类别向量g。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210861781.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top