[发明专利]一种基于余弦距离与动态时间规整的手势识别方法有效
申请号: | 201710482510.0 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107358171B | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 王志锋;刘清堂;张耀升;赵刚 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F3/01 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 余弦 距离 动态 时间 规整 手势 识别 方法 | ||
1.一种基于余弦距离与动态时间规整的手势识别方法,其特征在于,包括以下步骤:
步骤1:获取手部节点坐标值;
步骤2:使用倒序识别法来截取手部动作序列;
步骤3:将手势坐标序列进行向量化的特征分割,并通过这一过程收集注册的标准动作形成模板序列;
步骤4:通过余弦距离法对模板序列和待识别序列进行DTW检测,求得其累积距离矩阵以及最短距离值;
步骤4的具体实现包括以下子步骤:
步骤4.1:将模板序列中的手势Gestures目标和待识别序列中的手势Gestures用户分解为多个向量组成的序列:
Gestures目标={X[1],X[2],X[3],......,X[n-1],X[n]};
Gestures用户={x[1],x[2],x[3],......,x[n-1],x[n]};
然后对两个序列按照一定的距离要求进行DTW序列匹配:
DTW(Gesture目标,Gesture用户);
求出其最小距离,确定手势相似度;
步骤4.2:Gestures目标和Gestures用户它们的元素均由向量构成,在DTW矩阵中进行计算,设为Gestures目标中向量,设为Gestures用户中向量,计算向量和之间的余弦距离,将其作为两序列距离的衡量标准;其公式为:
cosθ值介于-1到1之间,且越接近于1,两个向量的在方向上越相似,越接近-1表示两向量方向距离越远;
步骤4.3:构造一个新函数
Y=1-cosθ;
则Y的取值范围为[0,2],越接近0,两个向量的方向距离越相近,越接近2两向量方向距离越远;将其作为动态时间规整算法中DTW矩阵的距离计算公式;
步骤4.4:将公式
Y=1-cosθ;
转化为:
DTW(Y(Gesture目标,Gesture用户));
即:
其中,n表示模板序列长度,m表示待识别序列长度,ω作为求和最优路径的匹配参数控制,按照DTW路径选择的情况不同,根据DTW矩阵路径选择的方法:
其中,d为两点距离,Mc为累计距离矩阵值,Mc(i,j)表示当前坐标距离累计距离值,d(i,j)表示当前坐标的余弦距离值;
则ω取值范围为:
ω={0,1,2};
步骤5:比较DTW检测所得到的最短距离值与设定的阈值之间的大小关系,从而确定动作是否触发,达到动作识别的目标。
2.根据权利要求1所述的基于余弦距离与动态时间规整的手势识别方法,其特征在于:步骤1中,运用Kinect深度图骨骼点坐标获取的功能获取手部节点坐标值。
3.根据权利要求1所述的基于余弦距离与动态时间规整的手势识别方法,其特征在于,步骤3的具体实现包括以下子步骤:
步骤3.1:设动态手势为D,静态手势为S;对于任何一个动态手势D,通过分割,转化为一个静态手势序列:
D≈{S[1],S[2],S[3],S[4],......,S[n-1],S[n]};
其中,n表示分割次数,n越大,等式两边越接近;该静态手势序列即为动态手势的特征序列;
步骤3.2:设X为空间向量,当n足够大时,两帧之间的向量即可表示为前一帧静态手势的方向特征,则:
D≈{S[1],S[2],S[3],S[4],......,S[n-1],S[n]};
转化为:
D≈{X[1],X[2],X[3],X[4],......,X[n-1],X[n]};
步骤3.3:通过步骤3.2中的分割过程,获得标准动作对应的模板序列Gestures目标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710482510.0/1.html,转载请声明来源钻瓜专利网。