[发明专利]基于动态频域分解的音乐驱动的指挥动作生成方法有效
申请号: | 202111090067.5 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113793582B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 刘凡;陈德龙;周睿志;潘艳玲;许峰 | 申请(专利权)人: | 河海大学 |
主分类号: | G10H1/00 | 分类号: | G10H1/00 |
代理公司: | 南京品智知识产权代理事务所(普通合伙) 32310 | 代理人: | 杨陈庆 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 分解 音乐 驱动 指挥 动作 生成 方法 | ||
1.一种基于动态频域分解的音乐驱动的指挥动作生成方法,其特征在于,包括如下步骤:
步骤1,分别将音频特征序列和指挥动作序列切分为若干个时间片段;
步骤2,对于每一个时间片段的样本对,使用音乐节奏估计算法计算得到该片段的节奏值;
步骤3,根据步骤2中获得的节奏值计算得到对应时间片段的频率阈值;
步骤4,根据各时间片段的频率阈值以及设定的噪音阈值设计滤波器,将指挥动作序列分解为3个动作分量;
步骤5,通过两个以均方根误差MSE作为损失函数的卷积神经网络模型分别对高低频动作分量进行独立学习;
步骤6,将两个模型的输出合成为最终的指挥动作;
所述步骤4的具体过程为:
4-1、根据频率阈值计算低通滤波器归一化截止频率Wl,
其中,表示第k个时间片段的频率阈值,SR表示采样频率,采用25Hz的采样频率;
4-2、设计低通滤波器,为了提高滤波的效果,令滤波器阶数M为常数8,根据归一化截止频率Wn,l和阶数M可构造一个巴特沃斯低通滤波器,二维数组中每一列数据对应一个信号,将所有信号依次输入滤波器,输出的信号按列拼接后即为第k个时间片段指挥动作的低频分量
4-3、将所有时间片段上的低频动作分量进行拼接,方式如下:
其中,Yl,i表示时长为T的指挥动作低频分量,表示第j个时间片段的指挥动作低频分量,j=1~k;
4-4、根据频率阈值计算带通滤波器归一化截止频率[Wbl,Wbh]:
Wbh=2*fnoise/SR
其中,fnoise表示本发明设定的大小为5Hz的噪音阈值;SR含义和步骤4-1中相同;
4-5、设计带通滤波器,为了提高滤波的效果,令滤波器阶数M为常数8,根据归一化截止频率[Wbl,Wbh]和阶数M可构造一个巴特沃斯带通滤波器,二维数组中每一列数据对应一个信号,将所有信号依次输入滤波器,输出的信号按列拼接后即为第k个时间片段指挥动作的高频分量
4-6、将所有时间片段上的高频动作分量进行拼接,方式如下:
其中,Yh,i表示时长为T的指挥动作高频分量,表示第j个时间片段的指挥动作高频分量;
4-7、根据设定的噪音阈值计算高通滤波器归一化截止频率Wh:
Wh=2*fnoise/SR
4-8、设计高通滤波器,为了提高滤波的效果,令滤波器阶数M为常数8,根据归一化截止频率Wh和阶数M可构造一个巴特沃斯高通滤波器,二维数组中每一列数据对应一个信号,将所有信号依次输入滤波器,输出的信号按列拼接后即为第k个时间片段指挥动作的噪音分量
4-9、将所有时间片段上的噪音动作分量进行拼接,方式如下:
其中,Ynoise,i表示时长为T的指挥动作噪音分量,表示第j个时间片段的指挥动作噪音分量。
2.根据权利要求1所述的基于动态频域分解的音乐驱动的指挥动作生成方法,其特征在于,所述步骤1的具体过程为:
1-1、给定N个样本的数据集其中表示时长为T的音频特征序列,表示时长为T的指挥动作序列样本,xt和yt分别为第t个时间步上的p维音频特征xt∈Rp和q个关键点的2维骨架坐标yt∈R2q;
1-2、分别对音频特征序列Xi和指挥动作序列Yi进行时域分解,即切分为k个时间片段表示第k个时间片段的音频特征序列,表示第k个时间片段的指挥动作序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111090067.5/1.html,转载请声明来源钻瓜专利网。