[发明专利]一种基于余弦距离与动态时间规整的手势识别方法有效

申请号：	201710482510.0	申请日：	2017-06-22
公开（公告）号：	CN107358171B	公开（公告）日：	2019-08-02
发明（设计）人：	王志锋;刘清堂;张耀升;赵刚	申请（专利权）人：	华中师范大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06F3/01
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	魏波
地址：	430079 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于余弦距离动态时间规整手势识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于余弦距离与动态时间规整的手势识别方法，其特征在于，包括以下步骤：

步骤1：获取手部节点坐标值；

步骤2：使用倒序识别法来截取手部动作序列；

步骤3：将手势坐标序列进行向量化的特征分割，并通过这一过程收集注册的标准动作形成模板序列；

步骤4：通过余弦距离法对模板序列和待识别序列进行DTW检测，求得其累积距离矩阵以及最短距离值；

步骤4的具体实现包括以下子步骤：

步骤4.1：将模板序列中的手势Gestures_目标和待识别序列中的手势Gestures_用户分解为多个向量组成的序列：

Gestures_目标＝{X[1],X[2],X[3],......,X[n-1],X[n]}；

Gestures_用户＝{x[1],x[2],x[3],......,x[n-1],x[n]}；

然后对两个序列按照一定的距离要求进行DTW序列匹配：

DTW(Gesture_目标，Gesture_用户)；

求出其最小距离，确定手势相似度；

步骤4.2：Gestures_目标和Gestures_用户它们的元素均由向量构成，在DTW矩阵中进行计算，设为Gestures_目标中向量，设为Gestures_用户中向量，计算向量和之间的余弦距离，将其作为两序列距离的衡量标准；其公式为：

cosθ值介于-1到1之间，且越接近于1，两个向量的在方向上越相似，越接近-1表示两向量方向距离越远；

步骤4.3：构造一个新函数

Y＝1-cosθ；

则Y的取值范围为[0,2]，越接近0，两个向量的方向距离越相近，越接近2两向量方向距离越远；将其作为动态时间规整算法中DTW矩阵的距离计算公式；

步骤4.4：将公式

Y＝1-cosθ；

转化为：

DTW(Y(Gesture_目标，Gesture_用户))；

即：

其中，n表示模板序列长度，m表示待识别序列长度，ω作为求和最优路径的匹配参数控制，按照DTW路径选择的情况不同，根据DTW矩阵路径选择的方法：

其中，d为两点距离，Mc为累计距离矩阵值，Mc(i,j)表示当前坐标距离累计距离值，d(i,j)表示当前坐标的余弦距离值；

则ω取值范围为：

ω＝{0,1,2}；

步骤5：比较DTW检测所得到的最短距离值与设定的阈值之间的大小关系，从而确定动作是否触发，达到动作识别的目标。

2.根据权利要求1所述的基于余弦距离与动态时间规整的手势识别方法，其特征在于：步骤1中，运用Kinect深度图骨骼点坐标获取的功能获取手部节点坐标值。

3.根据权利要求1所述的基于余弦距离与动态时间规整的手势识别方法，其特征在于，步骤3的具体实现包括以下子步骤：

步骤3.1：设动态手势为D，静态手势为S；对于任何一个动态手势D，通过分割，转化为一个静态手势序列：

D≈{S[1],S[2],S[3],S[4],......,S[n-1],S[n]}；

其中，n表示分割次数，n越大，等式两边越接近；该静态手势序列即为动态手势的特征序列；

步骤3.2：设X为空间向量，当n足够大时，两帧之间的向量即可表示为前一帧静态手势的方向特征，则：

D≈{S[1],S[2],S[3],S[4],......,S[n-1],S[n]}；

转化为：

D≈{X[1],X[2],X[3],X[4],......,X[n-1],X[n]}；

步骤3.3：通过步骤3.2中的分割过程，获得标准动作对应的模板序列Gestures_目标。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华中师范大学，未经华中师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710482510.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于移动机器视觉的车辆违章压线识别方法
下一篇：一种基于人脸朝向分类的人脸特征点初始化方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于余弦距离与动态时间规整的手势识别方法有效

专利文献下载