[发明专利]一种基于DTW距离的手语视频关键帧采样方法有效
申请号: | 202110324935.5 | 申请日: | 2021-03-26 |
公开(公告)号: | CN113312959B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 叶中付;潘威 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06K9/62;G06V10/74 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;付久春 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dtw 距离 手语 视频 关键 采样 方法 | ||
1.一种基于DTW距离的手语视频关键帧采样方法,其特征在于,包括如下步骤:
步骤1、获取原始手语视频的原始手语帧序列;
步骤2、从所述原始手语帧序列中通过关键帧采样得到初始关键帧序列;
步骤3、以所述初始关键帧序列作为初始值,通过贪心算法从所述初始关键帧序列中计算得出与原始手语帧序列具有更高相似度的关键帧序列,所述初始关键帧序列与原始手语帧序列之间的相似度以DTW距离度量,DTW距离越小,则该初始关键帧序列与原始手语帧序列的相似度越高;
所述步骤3中,通过以下方式计算所得关键帧序列与原始手语帧序列之间的相似度,包括:
从原始手语帧序列X=(x1,x2,…,xT)得到的初始关键帧序列为Y=(y1,y2,…,yN),序列X和Y为不等长序列,其中
构造尺度为T×N的矩阵M,该矩阵M中的每个元素为:Mij=||xi-yj||2(1≤i≤T,1≤j≤N);其中,||xi-yj||2表示两帧之间的像素欧式距离,该像素欧式距离的大小与两帧之间的相似度的高低呈反相关;
在所述矩阵M中从始元素点(1,1)开始匹配序列X和Y,每到一个元素点对设定的累加距离γ(i,j)进行累加,到达终点(T,N)后,得出的累加距离γ(T,N)即为表示序列X和Y之间相似度的DTW距离,所述累加距离γ(i,j)为当前元素点Mij与所有能到达该元素点的相邻元素点的累加距离的最小值之和:γ(i,j)=Mij+min(γ(i,j-1),γ(i-1,j),γ(i-1,j-1));
以初始关键帧序列作为初始值,用下述贪心算法进行优化计算得出与原始手语帧序列具有更高相似度的关键帧序列,包括:
设置s0=1,sN+1=T,j*=s1,γmin=γ(X,Y);
对于1≤i≤N:
对si≤j≤si+1进行遍历搜索,将yi分别用xj代替,得到新序列Y*,计算新序列Y*与X之间的累加距离γ(X,Y*),如果累加距离γ(X,Y*)≤γmin,则进行如下的替换操作:
j*=j,γmin=γ(X,Y*);
对si≤j≤si+1搜索遍历结束后,更新si=j*,
将按上述处理得到的新序列Y*作为新的关键帧序列;
步骤4、迭代进行所述步骤3的处理,获得不丢失所述初始关键帧序列特性并与原始手语帧序列具有最高相似度的关键帧序列,作为原始手语视频的最终关键帧序列;
所述步骤4中,迭代进行所述步骤3的处理的流程如下:
初始化设置:Y1=Y*,n=1,M=1,F1=F(Y1)=(1-λ)*γ(X,Y1)+λ*γ(Y,Y1);
对n进行C轮的迭代计算,即1≤n≤C:
计算Yn+1=A(Yn),Fn+1=F(Yn+1)=(1-λ)*γ(X,Yn+1)+λ*γ(Y,Yn+1);
如果Fn+1FM则:M=n+1;
在上述处理中,如果提前收敛到恒定解,即满足当n达到某个指定值时,Fn+1=Fn对之后的所有n值都成立,则提前退出循环,否则就通过C控制循环的次数;
上述迭代处理中,F(Y1)=(1-λ)*γ(X,Y1)+λ*γ(Y,Y1)为新偏移函数,用于确定新生成的关键帧序列Y1与原始手语帧序列X和初始关键帧序列Y的相似度,该新偏移函数中,Y1是某个新生成的关键帧序列;γ(X,Y1)和γ(Y,Y1)是序列Y1与序列X和Y之间的DTW距离;λ是权重因子,用来表示γ(X,Y1)与γ(Y,Y1)两者在该偏移函数中所占有的比重;
上述迭代处理中,将所述步骤3中对初始关键帧序列Y进行贪心算法优化的整个流程定义为A,Y*=A(Y);
上述迭代处理的计算结果为:得到的最终关键帧序列为YM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110324935.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种立体档案袋的生产工艺
- 下一篇:一种用于公用垃圾桶的智能垃圾桶支架