[发明专利]静态图像行为识别的卷积神经网络模型在审
申请号: | 201910994597.9 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110751091A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 于祥春;张哲;吴垒;庞巍;陈贺昌;于哲舟;李斌 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 13128 石家庄轻拓知识产权代理事务所(普通合伙) | 代理人: | 王占华 |
地址: | 341000 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 卷积神经网络 图像 动作信息 静态图像 模块输出 模块通道 人类行为 神经网络 图像处理 行为识别 训练过程 多分支 分类器 辨识 权重 微调 输出 分类 探索 学习 | ||
1.一种静态图像行为识别的卷积神经网络模型,其特征在于包括:
VGG16卷积层模块,用于对输入的图像进行多次的卷积和池化处理,提取具有判别性的深度特征;
多分支卷积层模块,用于通过不同的分支来分别学习VGG16卷积层模块最后一层输出的特征,该模块的卷积层权重在训练过程中随机初始;
softmax分类器层模块,用于对三分支卷积层模块输出的特征进行分类。
2.如权利要求1所述的静态图像行为识别的卷积神经网络模型,其特征在于:所述多分支卷积层模块设置三个不同的分支,
第一个分支包括一个卷积层,采用1×1的卷积核,过滤器个数为128;
第二个分支包括两个卷积层,第一个卷积层与第一分支一样,第二个卷积层,采用3×3的卷积核,过滤器个数为128;
第三个分支包括一个平均池化层和一个卷积层,平均池化层的池化大小为3×3,卷积层采用3×3的卷积核,过滤器个数为128。
3.如权利要求1所述的静态图像行为识别的卷积神经网络模型,其特征在于:所述softmax分类器层模块包括三个全连接层,第一层和第二层大小为2048,在这两个层中添加L2正则化项,并且将该正则化项系数的权重设置为0.001,第三层大小为7。
4.如权利要求1所述的静态图像行为识别的卷积神经网络模型,其特征在于,所述网络模型的训练过程如下:
权重初始阶段:VGG16卷积层模块的权重由预训练VGG16模型的权重初始;多分支卷积层模块和softmax分类器层模块的权重随机初始;
权重训练阶段:VGG16卷积层模块的权重被冻结,在训练过程中这个模块的所有权重固定不变;多分支卷积层模块和softmax分类器层模块的权重通过优化算法进行调整;
数据增强阶段:在训练过程中通过对数据进行转换变化操作产生更多的数据,具体的参数设置如下:旋转参数范围:0-90度,宽度移位范围:0-0.2,高度移位范围:0-0.2,斜切变化范围:0-0.2,并且设置水平和垂直翻转。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910994597.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序