[发明专利]一种红外视频中的动作识别方法及系统在审
申请号: | 202111605038.8 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114299610A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 聂嘉豪;阎龙斌;王修珩;陈捷 | 申请(专利权)人: | 声耕智能科技(西安)研究院有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06N3/04;G06K9/62;G06V10/82;G06V10/774 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 王艾华 |
地址: | 710000 陕西省西安市雁塔区丈八街*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 红外 视频 中的 动作 识别 方法 系统 | ||
1.一种红外视频中的动作识别方法,其特征在于,包括以下步骤:
S1:采集红外视频数据;
S2:将所述获取的红外视频数据输入预先设定的膨胀三维卷积神经网络,并利用所述膨胀三维卷积神经网络识别所述红外视频数据;
S3:获取所述红外视频数据的识别结果。
2.根据权利要求1所述的一种红外视频中的动作识别方法,其特征在于,步骤S2中所述膨胀三维卷积神经网络包括卷积部分、设置在卷积部分末端的残差全连接部分。
3.根据权利要求2所述的一种红外视频中的动作识别方法,其特征在于,所述卷积部分包括三个三维卷积层,五个池化层,以及九个感知模块;所述感知模块包括六个三维卷积层和两个池化层;所述残差全连接部分包括四个残差全连接层。
4.根据权利要求2所述的一种红外视频中的动作识别方法,其特征在于,所述膨胀三维卷积神经网络的构建包括以下步骤:
S201:对InfAR数据集进行预处理,获得训练数据集;
S202:将所述训练数据集的红外视频数据转换为对应的训练数据集伪彩版本,并从所述训练数据集伪彩色版本的图片序列中提取训练数据集TVL1光流数据;
S203:采用Kinetics数据集对所述的膨胀三维卷积神经网络进行预训练,得到所述神经网络的初步运行参数;
S204:采用所述训练数据集TVL1光流数据以及所述初步运行参数再次训练所述神经网络,完成所述膨胀三维卷积神经网络的构建。
5.根据权利要求4所述的一种红外视频中的动作识别方法,其特征在于,所述膨胀三维卷积神经网络的构建还包括:对InfAR数据集进行预处理,获得测试数据集,并将所述测试数据集的红外视频数据转换为对应的测试数据集伪彩版本,并从所述测试数据集伪彩色版本的图片序列中提取测试数据集TVL1光流数据;采用所述测试数据集TVL1光流数据以及所述初步运行参数对所述神经网络进行测试。
6.根据权利要求4所述的一种红外视频中的动作识别方法,其特征在于,步骤S201中所述预处理包括剔除InfAR数据集中的噪音数据,并将保留的红外视频数据切分为若干视频帧,从若干视频帧中随机选择部分视频帧作为所述训练数据集,其余视频帧作为所述测试数据集。
7.根据权利要求4所述的一种红外视频中的动作识别方法,其特征在于,采用所述训练数据集TVL1光流数据以及所述第一运行参数训练所述膨胀三维卷积神经网络之前,将所述训练数据集TVL1光流数据中的每个视频帧均进行水平翻转处理。
8.一种红外视频中的动作识别系统,其特征在于,包括:
数据采集模块,用于采集红外视频数据;
视频识别模块,用于将所述获取的红外视频数据输入预先设定的膨胀三维卷积神经网络,并利用所述膨胀三维卷积神经网络识别所述红外视频数据;
结果输出模块,用于获取所述红外视频数据的识别结果。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时运行如权利要求1-7任一项所述的神经网络。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一项的神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声耕智能科技(西安)研究院有限公司,未经声耕智能科技(西安)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111605038.8/1.html,转载请声明来源钻瓜专利网。