[发明专利]一种基于空洞卷积的高时序3D神经网络的动作识别方法有效
申请号: | 201910436122.8 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110334589B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 徐永洋;冯雅兴;谢忠;胡安娜;曹豪豪 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 易滨 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于空洞卷积的高时序3D神经网络的动作识别方法,包括:首先对三维Inception‑V1神经网络模型进行改进,得到改进后的三维Inception‑V1神经网络模型;然后将公开数据集分为训练集和测试集对改进后的三维Inception‑V1神经网络模型进行训练和测试,得到训练后的高精度三维Inception‑V1神经网络模型;最后采用训练后的高精度三维Inception‑V1神经网络模型对实际视频的动作进行识别。本发明的有益效果是:本发明所提出的技术方案在保持高时序性的同时引入新的非局部特征门算法来重新定义三维Inception‑V1神经网络模型通道权重,提高了模型准确率。 | ||
搜索关键词: | 一种 基于 空洞 卷积 时序 神经网络 动作 识别 方法 | ||
【主权项】:
1.一种基于空洞卷积的高时序3D神经网络的动作识别方法,其特征在于,包括如下步骤:S101:获取公开数据集,并将所述数据集划分为训练集和测试集;所述公开数据集包括UCF101和HMDB51两个公开数据集;S102:对三维Inception‑V1神经网络模型进行改进,得到改进后的三维Inception‑V1神经网络模型;S103:将所述训练集和所述测试集中的所有视频分别进行预处理,得到所述训练集和所述测试集对应的帧图像训练数据和帧图像测试数据;S104:采用所述帧图像训练数据和所述帧图像测试数据对所述改进后的三维Inception‑V1神经网络模型分别进行训练及测试,以对所述改进后的三维Inception‑V1神经网络模型的内部参数进行训练,进而得到训练后的高精度三维Inception‑V1神经网络模型;S105:将待识别的视频进行预处理,得到预处理后的帧图像数据;S106:将所述预处理后的帧图像数据输入所述训练后的高精度三维Inception‑V1神经网络模型,得到所述待识别的视频所属的动作类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910436122.8/,转载请声明来源钻瓜专利网。