[发明专利]一种时序事件动作检测方法有效
申请号: | 201910541650.X | 申请日: | 2019-06-21 |
公开(公告)号: | CN110427807B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 韩红 | 申请(专利权)人: | 诸暨思阔信息科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/20;G06V10/40;G06V10/82;G06V10/25;G06V20/50;G06V10/764;G06N3/08;G06N3/04 |
代理公司: | 广东东莞市中晶知识产权代理事务所(普通合伙) 44661 | 代理人: | 张海英 |
地址: | 311800 浙江省绍兴市诸暨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时序 事件 动作 检测 方法 | ||
1.一种时序事件动作检测方法,其特征在于,所述方法包括:
将输入视频转化为视频帧后,找到关键帧的时序关联片段,选择3D卷积神经网络进行时序建模提取关键帧前后的动作特征;
所述的提取关键帧前后的动作特征具体的包括:
将输入视频转化为视频帧后,以每一个视频帧为关键帧,做研究对象,先找到该关键帧的时序关联片段,以获得上下文信息,确定时序关联片段长度后,以关键帧为中心,找到前后对应一半长度的开始帧和结束帧,从而确定时序关联片段,如果关键帧本身靠近开始帧或者结束帧,导致时序关联片段长度不够时,则需要重复堆叠开始帧或者结束帧,以保证统一的时序关联片段长度,方便3D卷积神经网络提取相应的动作特征,选择3D卷积神经网络进行时序建模,使用3D卷积神经网络提取关键帧时序关联片段的动作特征,对该时序片段预处理;
获取了关键帧的时续关联片段特征后,利用RPN网络中动作特征提出候选区域;
所述的获取了关键帧的时续关联片段特征后,利用动作特征提出候选区域,利用RPN网络中动作特征提名候选区域的具体操作是:先生成锚框,再经过非极大值抑制算法,从这些候选提名中选取置信度相对较高的2000个提名;
对候选区域进行动作识别;
所述的对候选区域进行动作识别具体包括利用conv5层的2D残差块对动作特征建模,通过多分类交叉熵得到动作类别,对于候选区域的位置信息利用样本真实标注框和smooth1L函数回归,精确定位,并再次通过非极大值抑制算法,在IOU为0.6的条件下,得到最后动作检测结果,完成整个端到端的网络搭建;
生成UCF24数据集;
处理UCF24数据集,经过筛选简化后,进行实验并对结果分析。
2.根据权利要求1所述的一种时序事件动作检测方法,其特征在于:处理UCF24数据集,经过筛选简化后,对基于P3D和Faster RCNN网络的动作检测算法进行实验,对比基础算法,分析优劣,得出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诸暨思阔信息科技有限公司,未经诸暨思阔信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910541650.X/1.html,转载请声明来源钻瓜专利网。