[发明专利]一种基于深度学习的视频行为识别方法在审

专利信息
申请号: 201910624511.3 申请日: 2019-07-11
公开(公告)号: CN110348381A 公开(公告)日: 2019-10-18
发明(设计)人: 屈鸿;侯帅;杨昀欣;贺强;李彦 申请(专利权)人: 电子科技大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04
代理公司: 成都东唐智宏专利代理事务所(普通合伙) 51261 代理人: 罗言刚
地址: 611731 四川省成都市高新区(*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 帧图像数据 训练集 神经网络模型 处理数据 行为识别 预测循环 测试集 帧图像 预设 视频 循环神经网络 归一化处理 注意力机制 比例常数 简化运算 人体行为 视频数据 输入特征 数量相等 特征输入 通道像素 预测结果 识别率 数据集 正确率 帧处理 维度 消减 测试 学习 图片 应用 网络
【权利要求书】:

1.一种基于深度学习的视频行为识别方法,其特征在于,包括以下步骤:

S1.将人体行为视频数据随机均匀切帧处理,得到预设数量相等的帧图像数据;

S2.将每帧图像数据组成的数据集按照比例常数划分成训练集和测试集;

S3.采用进行每通道像素均值消减法分别对训练集和测试集中的帧图像数据进行归一化处理,得到帧图像处理数据;

S4.将帧图像处理数据输入特征提取网络ResNet-50中提取出图片的特征;

S5.将训练集对应的图片的特征输入循环神经网络进行训练,直到预测结果的正确率大于预设值时,得到预测循环神经网络模型;

S6.将测试集运用预测循环神经网络模型进行识别得到识别结果。

2.如权利要求1所述的一种基于深度学习的视频行为识别方法,其特征在于,步骤S2之前需要每帧图像数据进黑边处理,具体步骤如下:

1).将帧图像数据通过borderFinder函数在O(logn)时间复杂度内找到图片边缘所在的线;

2).去除帧图像数据的三通道像素值的和小于阈值的像素点,得到裁剪掉多余的黑边的帧剪裁图像数据。

3.如权利要求2所述的一种基于深度学习的视频行为识别方法,其特征在于,每通道像素均值消减法为:

1).计算训练集中的帧剪裁图像数据中每个通道像素值的平均值;

2).再将训练集中每张帧剪裁图像数据的每个通道的像素值减去对应通道的平均像素值,后除以对应通道像素值的方差得到每个像素处理后对应的值。

4.如权利要求1所述的一种基于深度学习的视频行为识别方法,其特征在于,步骤S4中,通过特征提取网络ResNet-50后生成一个长度为2048的特征向量。

5.如权利要求4所述的一种基于深度学习的视频行为识别方法,其特征在于,循环神经网络包括一个双向的LSTM网络,LSTM网络接收所述的特征向量,将每个时刻的特征向量输入网络后会输出该时刻的行为类别yi以及上述的空间注意力矩阵pi,然后通过一个在时间维度的注意力机制在综合每个时刻的输出的行为类别,得到预测结果;所述注意力机制为模型每个时刻的输出赋予一个权重,通将所有时刻输出进行加权求和得到模型的预测结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910624511.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top