[发明专利]静态图像行为识别的卷积神经网络模型在审
申请号: | 201910994597.9 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110751091A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 于祥春;张哲;吴垒;庞巍;陈贺昌;于哲舟;李斌 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 13128 石家庄轻拓知识产权代理事务所(普通合伙) | 代理人: | 王占华 |
地址: | 341000 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 卷积神经网络 图像 动作信息 静态图像 模块输出 模块通道 人类行为 神经网络 图像处理 行为识别 训练过程 多分支 分类器 辨识 权重 微调 输出 分类 探索 学习 | ||
本发明公开了一种静态图像行为识别的卷积神经网络模型,涉及图像处理方法技术领域。所述模型包括:VGG16卷积层模块,用于对输入的图像进行处理;多分支卷积层模块,用于通过不同的分支来分别学习VGG16卷积层模块最后一层输出的特征,该模块的卷积层权重在训练过程中随机初始;softmax分类器层模块,用于对三分支卷积层模块输出的特征进行分类。所述模型可以更加有效的探索VGG16卷积层模块通道中的信息,而且可起到了微调神经网络中最高层权重的效果;因此,可以更加有效的辨识出单幅静态人类行为图像中的动作信息。
技术领域
本发明涉及图像处理方法技术领域,尤其涉及一种静态图像行为识别的卷积神经网络模型。
背景技术
人类行为识别是计算机视觉领域的重要研究内容之一。大部分关于人类行为识别的研究都是基于视频而不是单幅图像的方法,但是有很多常见的人类行为可以通过单幅图像就可以很充分地表示一个行为,例如,打电话、电脑交互、射击等。即使这些动作的视频信息可用,但是仍然需要基于静态线索的方法,例如弹吉他、骑马、跑步等,也就是说这些人类行为的运动幅度小,运动轨迹没有辨别性,因此识别这些动作还是要采用基于单幅图像的静态方法。
基于深度学习的算法在计算机视觉领域取得了巨大的成果,具体地,在人脸识别、目标位置预测等领域已经被广泛应用。基于视频的人类行为识别其本质是在连续变化的图像帧序列上的动作分析和分类问题。卷积神经网络(Convolutional Neural Networks,CNNs)是当前图像识别领域中主流的分类模型,但是现实生活中的大量人类行为类别具有静态属性,从而致使基于视频的人类行为识别技术在该种类的人类行为识别中失效。因此,为了解决这个问题,本发明专利开发一种应用于静态图像行为识别的卷积神经网络模型。
发明内容
本发明所要解决的技术问题是如何提供一种应用于静态图像行为识别的卷积神经网络模型。
为解决上述技术问题,本发明所采取的技术方案是:一种静态图像行为识别的卷积神经网络模型,其特征在于包括:
VGG16卷积层模块,用于对输入的图像进行多次的卷积和池化处理,提取具有判别性的深度特征;
多分支卷积层模块,用于通过不同的分支来分别学习VGG16卷积层模块最后一层输出的特征,该模块的卷积层权重在训练过程中随机初始;
softmax分类器层模块,用于对三分支卷积层模块输出的特征进行分类。
进一步的技术方案在于,所述多分支卷积层模块设置三个不同的分支:
第一个分支包括一个卷积层,采用1×1的卷积核,过滤器个数为128;
第二个分支包括两个卷积层,第一个卷积层与第一分支一样,第二个卷积层,采用3×3的卷积核,过滤器个数为128;
第三个分支包括一个平均池化层和一个卷积层,平均池化层的池化大小为3×3,卷积层采用3×3的卷积核,过滤器个数为128。
进一步的技术方案在于:所述softmax分类器层模块包括三个全连接层,第一层和第二层大小为2048,在这两个层中添加L2正则化项,并且将该正则化项系数的权重设置为0.001,第三层大小为7。
进一步的技术方案在于,所述网络模型的训练过程如下:
权重初始阶段:VGG16卷积层模块的权重由预训练VGG16模型的权重初始;多分支卷积层模块和softmax分类器层模块的权重随机初始;
权重训练阶段:VGG16卷积层模块的权重被冻结,在训练过程中这个模块的所有权重固定不变;多分支卷积层模块和softmax分类器层模块的权重通过优化算法进行调整;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910994597.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序