[发明专利]一种从视频中自动识别人体行为的方法在审
申请号: | 201910415244.9 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110163144A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 张朝龙;许源平;许志杰;曹衍龙;何嘉 | 申请(专利权)人: | 成都信息工程大学;许源平;张朝龙;许志杰;曹衍龙;何嘉 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/246 |
代理公司: | 成都智弘知识产权代理有限公司 51275 | 代理人: | 丁亮;陈春 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 底层特征 特征编码 人体行为 自动识别 视频 人体行为识别 多尺度特征 原始视频帧 理论设计 缺失频率 人体运动 时间特征 时间信息 视觉单词 小波变化 小波分析 运动视频 贡献度 相似度 有效地 正确率 构建 尺度 分解 引入 申请 表现 统计 | ||
本申请公开了一种从视频中自动识别人体行为的方法及装置,引入小波分析理论,把原始视频帧分解到不同的频率和方向上,从而可以方便地从不同频率和方向上提取人体运动底层特征。使用相似度来表示贡献程度,从而可以避免因BoF码书的尺度不同而导致错误的指定方式,也可以表现不同底层特征对同一个视觉单词统计的贡献度。构建的BoTF特征编码方式可以有效地对底层特征的时间信息进行编码,从而克服BoF编码无序的缺点。基于小波变化和图相关理论设计一个多尺度特征提取和特征编码方法,解决DT方法缺失频率和方向以及BoF特征编码模型缺乏时间特征的问题,从而可以处理复杂的运动视频,并大大提高人体行为识别的正确率。
技术领域
本申请涉及人体行为识别技术领域,具体涉及一种从视频中自动识别人体行为的方法及装置。
背景技术
目前,智能视频监控技术在智能安防和公共安全领域都具有重要的应用价值。智能视频监控技术是一个跨领域的应用研究,人体行为识别是其中一个重要的研究内容,而从监控视频中自动提取人体行为运动特征是其中关键的技术点。
传统的运动底层特征自动提取主要包括尺度不变特征变换(Scale-InvariantFeature Transform,SIFT)、Harris角点检测、时空体数据(Spatial Temporal Volume,STV)特征和密集轨迹追踪(Dense Trajectories,DT)等特征提取方法。DT是目前广泛使用的一种运动特征提取方法。该方法通过追踪各个尺度下的特征点生成运动轨迹,再根据这些轨迹提取运动底层特征,包括:轨迹形状(Trajectory Shapes,TS)、方向梯度直方图(Histogram of Oriented Gradients,HOG)、光流直方图(Histogram of Optical Flows,HOF)和运动边界直方图(Motion Boundary Histogram,MBH)。然后,使用视觉词袋模型(Bagof Features,BoF)对底层特征进行编码,生成运动特征描述。最后使用通用的机器学习分类器支持向量机(Support Vector Machine,SVM)进行人体行为分类。
当前,DT方法还存在以下问题,在底层特征提取的时候,缺少对图像信号频率和运行方向信息的提取,导致这两方面的特征信息丢失。而且由于生成的轨迹只包含非常短的时间信息,且BoF把底层特征编码为无序的特征描述,丢失了大量的人体运动时序信息,从而导致无法提取执行时间较长或与执行顺序非常相关的动作行为。以上缺点导致现有的方法无法提取复杂的人体运动行为特征,进而导致当前人体行为智能识别系统的正确识别率偏低。
发明内容
本申请为了解决上述技术问题,提出了如下技术方案:
第一方面,本申请实施例提供了一种从视频中自动识别人体行为的方法,所述方法包括:将从视频图像中获取的原始视频帧分解到不同尺度上并进行小波变换分解;分别对所述多尺度分解后的视频帧和小波分解后的视频帧进行密集采样获取视频帧中的特征点;在不同尺寸、频率和方向上分别追踪每个所述特征点,获得密集轨迹;根据每个轨迹和每个轨迹对应的STV时空体数据确定底层特征;分别对所述底层特征进行BoF编码和BoTF编码,所述BoF编码确定底层特征的统计分布,所述BoTF编码实现对底层特征的时间信息的编码;将所述BoF编码和BoTF编码后的底层特征进行加权特征融合,确定所述视频图像中的人体行为信息。
采用上述实现方式,引入小波分析理论,把多尺度分解后的视频帧分解到不同的频率和方向上,从而可以方便地从不同频率和方向上提取人体运动底层特征。使用相似度来表示贡献程度,从而可以避免因BoF码书的尺度不同而导致错误的指定方式,也可以表现不同底层特征对同一个视觉单词统计的贡献度。
构建的BoTF特征编码方式可以有效地对时间特征进行编码,从而克服BoF编码无序的缺点。基于小波变化和图相关理论设计一个多尺度特征提取和特征编码方法,解决DT方法缺失频率和方向以及BoF特征编码模型缺乏时间特征的问题,从而可以处理复杂的人体运动视频,并大大提高人体行为识别的正确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学;许源平;张朝龙;许志杰;曹衍龙;何嘉,未经成都信息工程大学;许源平;张朝龙;许志杰;曹衍龙;何嘉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910415244.9/2.html,转载请声明来源钻瓜专利网。