[发明专利]一种多视角动作识别方法有效
申请号: | 201410553477.2 | 申请日: | 2014-10-17 |
公开(公告)号: | CN104268586B | 公开(公告)日: | 2018-02-06 |
发明(设计)人: | 马华东;傅慧源;张征 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/64 | 分类号: | G06K9/64;G06K9/46;G06T7/00 |
代理公司: | 北京东正专利代理事务所(普通合伙)11312 | 代理人: | 刘瑜冬 |
地址: | 100088 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多视角动作识别方法,包括动作训练和动作识别两个过程。动作训练时,通过二维条件随机场的方法训练分类器;动作识别过程包括如下步骤提取时空兴趣点;计算特征描述子;特征描述子降维;特征描述子聚类,获得预处理文件;将预处理文件送入训练过程中得到的分类器。本发明充分利用了时空兴趣点之间的时空关系,有效地描述了不同动作之间的特征;采用K‑means聚类将不同动作聚集到不同的类别,增加了动作识别的区分度;通过引入二维条件随机场,对单个摄像头下的时间动作序列及多个摄像头之间的空间动作序列进行有效的建模,使得训练模型更加准确,从而实现了对人体动作的有效识别。 | ||
搜索关键词: | 一种 视角 动作 识别 方法 | ||
【主权项】:
一种多视角动作识别方法,其特征在于,该方法包括如下步骤:(1)动作训练过程,通过二维条件随机场的方法训练并获得分类器,这里的二维条件随机场是通过时间和空间两个维度对特征进行建模的二维条件随机场,其表达式如下:这里的Mm(Tm‑1,Tm|x)=exp(Ψm(Tm‑1,Tm|x))为构造矩阵,Ψm(Tm‑1,Tm|x)被定义为:表示不同视角之间的空间依赖关系及不同时刻之间的时间依赖关系以及随机变量x与其对应的状态标签的关系;其中,Tm‑1={y′1,m‑1,y′2,m‑1,…,y′c,m‑1}表示第m‑1列的状态序列;Tm={y1,m,y2,m,…,yc,m}表示第m列的状态序列;Erow(ω)={((i′,j′),(i,j))∈Erow:(i′,j′)∈I(ω‑1),(i,j)∈I(ω)}表示第ω‑1行与第ω行之间的边,即两个视角间的空间依赖关系;Ecolumn(m)={((i,j),(i,j))∈Ecolumn:(i,j)∈J(m‑1),(i,j)∈J(m)}表示第m‑1列与第m列之间的边,即两个时刻间的时间依赖关系;I(ω)={(i′,j′),Δrow(i′,j′)=ω}表示第ω行的随机变量集合,即第ω个视角的观察值序列;J(m)={(i,j),Δcolumn(i,j)=m}表示第m列的随机变量集合,即第m时刻的观察值序列;上述yi,j,yi’,j’,yi”,j”分别表示第(i,j),(i’,j’),(i”,j”)节点对应的状态标签;φ(eω,yi′,j′,yi,j,x)表示不同视角的空间依赖关系;表示不同时刻的时间依赖关系;ψ(v,yi′,j′,x)和ω(v,yi,j,x)表示每个随机变量与对应的状态标签的关系,α,β,γ,η,分别为四个势函数的权重;归一化因子被定义为:Z(x)=M1(x)M2(x)...Mn(x)=Πm=1nΨ(Tm-1,Tm|x);]]>(2)动作识别过程,利用步骤(1)获得的分类器识别动作;动作识别过程包括如下步骤:S1:提取待识别视频文件的时空兴趣点;S2:计算时空兴趣点所在区域的特征描述子;S3:对S2中所有的特征描述子降维;S4:将S3中降维后的特征描述子聚类,获得预处理文件;S5:将S4所得预处理文件送入训练过程中得到的分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410553477.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于柱塞泵的翻转工装
- 下一篇:一种U形内折弯钣金件夹紧工装