[发明专利]一种基于运动历史图像和集成学习器的视频动作识别方法有效
申请号: | 202010331129.6 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111523477B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 王瀛;何欣;徐奔;于俊洋;王泽浩 | 申请(专利权)人: | 河南大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/774 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 王鲜凯 |
地址: | 475001*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 运动 历史 图像 集成 学习 视频 动作 识别 方法 | ||
本发明提供了一种基于运动历史图像和集成学习器的视频动作识别方法。在提取视频中对象的运动信息时,基于运动历史图像方法提取了多重运动历史图像作为动作信息,并利用图像不变矩描述不同动作的特征差异,将得到的各个视频样本的运动特征输入XGBoost集成分类器进行训练,得到最终的分类模型。本发明仅需要较少的样本数量即可取得较好地视频动作识别效果。
技术领域
本发明属图像处理和动作识别技术领域,具体涉及一种基于运动历史图像和集成学习器的视频动作识别方法。
背景技术
视频动作识别是视频处理研究领域中的一个热门分支,在监控、行为分析等很多方面都得到重要应用。对于小噪声视频数据,在现有的视频动作识别方法中,主要有基于RGB图像和基于传感器数据的方法,主流使用的是基于RGB图像的方法,具体的方法多为RGB视频动作特征+机器学习分类的结构。提取视频中动作特征的常用方法有基于运动历史图像MHI(Motion History Image)、基于方向梯度直方图HOG(Histogram of OrientedGradient)的方法等。其中,基于HOG的方法是通过计算视频流中若干运动像素的方向梯度,整合这些像素的方向向量,构建出视频中对象的运动信息,但需要视频中表示动作的特定单帧图像。MHI是基于帧差法的方法,在一段视频流中在帧差的基础上调整每帧灰度值,越接近最终帧,图像表现出的灰度越亮。在小噪声环境下,基于HOG的方法相比较基于MHI的方法对动作描述能力相对较弱,MHI对其中对象的动作信息描述更加明确。这类方法具有简单、直观等优点,但其不足在于对噪声比较敏感。
对于视频数据提取的动作特征,有很多常用的对其进行训练分类的机器学习的方法,比如SVM、KNN等算法,基于深度学习的方法,比如神经网络等算法等。其中,普通的机器学习方法能力相对较弱,构建的分类模型往往准确率不足,深度学习的方法构建的模型识别能力较强但是运算量较大,在设备运算能力较差的情况下时间效率较低,而且基于深度学习的方法更多用于大数据量样本的动作识别模型构建。集成学习是基于普通机器学习方法而提出的方法,这类方法能力较强且运算量适中,在样本数量较小时不仅能保证准确率而且占据更大的时间效率优势,XGBoost算法是一种基于GBDT(Gradient BoostingDecision Tree)的梯度提升集成算法,它的基本思想是不断地添加基分类器,每次通过学习上一个基分类器的结果添加一个基分类器,对上一个基分类器的分类残差进行修整,一般采用梯度提升决策树作为基分类器,对于样本特征每棵树会生成一个分数,最终将每棵树的分数相加得到预测结果,XGBoost算法因内置多种优化方法,运行结果较好,而且相比较一般的的机器学习方法运算速度极快,介于集成学习方法的优势,本发明提出了基于RGB视频动作特征+集成学习分类的方法。
发明内容
为了克服现有技术的不足,本发明提供一种基于运动历史图像和集成学习器的视频动作识别方法。在提取视频中对象的运动信息时,基于运动历史图像方法提取了多重运动历史图像MMHI(Multiple Motion History Image)作为动作信息,并利用图像不变矩描述不同动作的特征差异,将得到的各个视频样本的运动特征输入XGBoost集成分类器进行训练,得到最终的分类模型。本发明减少了运动历史图像方法对样本数量的需求,并通过结合集成学习的方法,构建了新型的动作识别模型,相比较传统模型具有更好的识别效果。
一种基于运动历史图像和集成学习器的视频动作识别方法,其特征在于步骤如下:
步骤1:由公开的KTH视频数据集中抽取m个视频样本,并剔除其中的无效视频;其中,m的取值范围为(100,599);所述的无效视频为不能播放的损坏视频;
步骤2:对于步骤1得到的数据集中的每个视频样本,采用运动历史图像方法每隔n帧提取一次运动历史图像,并将提取的图像相加,得到该视频样本的多重运动历史图像;其中,n的取值范围为[5,20];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010331129.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机器人对话控制系统和方法
- 下一篇:联合消融导管
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序