[发明专利]一种视频序列中人体动作的识别方法无效
申请号: | 201110109440.7 | 申请日: | 2011-04-29 |
公开(公告)号: | CN102136066A | 公开(公告)日: | 2011-07-27 |
发明(设计)人: | 李宏亮;覃耀辉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周永宏 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 序列 人体 动作 识别 方法 | ||
技术领域
本发明属于计算机视觉技术领域,特别涉及一种人体动作的识别方法。
背景技术
现在数字化网络化的步伐正在逐步加快,视频监控系统上升参与到全行业的管理中已成为事实,以其直观性和实时性的优点而在各行各业特别是安全防范领域倍受青睐。随着摄像机等监控设备成本的日益降低,视频监控系统可以广泛地应用于银行、邮电、监狱、法庭、大型公共设施、大型仓库及军事基地等场所,公共安全领域起着日益重要的作用。但是目前监控系统的功能大多仅仅停留在监控人员对视频信号的人工监视和事后录像分析上,并没有充分利用到目前计算机技术高速发展所提供的巨大计算能力上。事实上,多数监控系统还是模拟式的,少数数字式的系统也仅仅是提供多画面显示及硬盘录像类的简单功能。现有的监控系统都不能实现实时主动的监督作用,即监控的智能化和无人化。智能监控系统能实现全天实时监控,并自动分析摄像机捕捉的图像数据,当异常发生时,能向安全保卫人员准确及时的发送警报,从而避免犯罪的发生,而视频监控的核心在于对人体动作的识别。
目前对人体动作的识别,主要有3种方法:(1)模板匹配的方法;(2)状态空间的方法;(3)基于模型的方法。
模板匹配方法(template matching)其优点是算法单间容易实现,时间开销少,对相差比较大的行为识别效果较好,但对细微差别的行为识别效果较差,对运动持续时间的变化及噪声比较敏感。
近年来,采用状态空间法开展人体动作行为识别的研究较多,具有代表性的是马尔可夫网络,隐马尔可夫模型(HMM,Hidden Markov Model)已经被广泛应用于视频、图像序列的预测、估计、检测与行为识别中。然而,状态空间法需要大量的训练样本来训练状态转移概率参数其准确度受到训练样本数量影响很大,状态序列识别过程其原理也是模板匹配,而由于行为的复杂性只靠模板匹配显然是不够的。
现在更多的人体动作行为识别研究者更倾向于把目光投向使用自然语言描述的方法对人体动作行为进行识别,使得人体动作行为的语义描述分析研究得到了一定的进展,用于视频图像中人体动作行为的自然语言描述,如建立2D、3D模型:首先,使用3D模型对人体瞬时姿势描述,使构建的模型尽可能与人体目标姿态相似,即图像中人体的边缘信息,或是把行为看成是2D静态姿势序列,通过基于模型的方法,对人体二维、三维姿势、角度、位置以及与环境中其它一些目标相对距离的变化等进行重建与估计最后生成人体动作行为描述的自然语言文本。但基于模型的方法的构建复杂度高难于实现,而目前自然语言描述的特征提取方法提取的特征非常的多,一个一百帧左右的视频提取出几百到几千个特征,处理时间开销大,因而不易于应用于实时系统。最近国外主要是以自然语言描述和各种概率模型的建立来进行为识别,但行为识别仍处于初级阶段。
上述各种方法不能在识别正确率和实时性之间达到平衡,即要么识别正确率比较高,但计算复杂度高,实时性差;要么计算复杂度低,实时性好,但识别正确率比较低。
发明内容
本发明的目的是为了解决现有的视频图像中人体动作识别方法在准确率和实时性之间的矛盾,提出了一种视频序列中人体动作的识别方法。
本发明的技术方案是:一种视频序列中人体动作的识别方法,包括特征提取和特征训练与识别两个过程,其中,
特征提取包括如下步骤:
S1.计算视频序列的像素运动变化频率图;
S2.划分像素运动变化频率图的区域,确定像素运动变化频率图中值大于某一阈值的区域,找到该区域中的像素的最小纵坐标和最小横坐标,以及最大纵坐标和最大横坐标,然后以此最小纵坐标和最小横坐标,最大纵坐标和最大横坐标确定一个目标区域,并按一定的比例在纵轴或横轴方向上划分若干个子区域;
S3.对目标区域和若干个子区域分别求像素变化直方图,具体如下:
S31.将目标区域的像素运动变化频率图中的值非均匀量化为N个量化值;
S32.分别求出目标区域和若干个子区域各个量化值对应在像素运动变化频率图中的值的和,这样每个区域就得到一个N维的直方图;
S33.将目标区域和若干个子区域的直方图平铺成一个多维的向量并归一化,得到像素变化直方图;
S4.对目标区域和若干个子区域分别求边缘梯度直方图;
S5.计算视频序列的差分边缘直方图,具体过程如下:计算当前帧与前一帧的差分图像,如果差分图像绝对值中的元素的最大值大于预设定的阈值,计算差分图像的边缘直方图,得到差分边缘直方图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110109440.7/2.html,转载请声明来源钻瓜专利网。