[发明专利]一种基于恒Q变换的复调电子琴音乐音符识方法有效

申请号：	202011236049.9	申请日：	2020-11-09
公开（公告）号：	CN112420071B	公开（公告）日：	2022-12-02
发明（设计）人：	彭丹卉;胡海波	申请（专利权）人：	上海交通大学
主分类号：	G10L25/18	分类号：	G10L25/18;G10L25/21;G10L25/51;G10L25/45
代理公司：	上海旭诚知识产权代理有限公司 31220	代理人：	郑立
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于变换复调电子琴音乐音符方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于恒Q变换的电子琴复调音乐的音符识别方法，其特征在于，包括以下步骤：

步骤1、获取电子琴单音音符的单音音频，对单音音频做所述恒Q变换得到时频图，将不同时间得到的频谱数据平均后得到单音频谱模板；

步骤2、对电子琴弹奏音乐进行采集并进行中值滤波的预处理去噪；

步骤3、对弹奏音乐信号进行分帧加窗处理；

步骤4、对所述弹奏音乐信号进行音符的切分，具体的方法为：采用超通量和计算相邻两帧的频谱向量差的方法寻找分析时间段内能量曲线的局部最大值以确定起始点的位置；所述超通量算法具体内容包括：对所述恒Q变换的幅值做对数处理，对频率方向的幅值采取最大值滤波，其公式为：

其中n表示时间帧，m表示频率分量，x_log为对数化后的幅值；

超通量比较相邻两帧的能量差的公式为：

其中F表示频率范围，μ≥1，μ表示两个时间帧之间的间隔，得到与时间相关的SF值以后对该数据进行半波整流后寻找时间段内大于平均值的极大值点作为起始点候补；

所述计算相邻两帧的频谱向量差的方法为，基于所述恒Q变换得到的结果包含幅值和相位信息，将相邻两帧以向量的方式相减，得到的向量差的幅值作为能量变化比较的标准，公式为：

其中cfs表示所述恒Q变换后的原始数据，f(m)表示m频谱分量对应的频率，得到与时间相关的d值以后寻找时间段内大于平均值的极大值点作为起始点候补；

根据所述超通量算法和所述计算相邻两帧的频谱向量差的方法这两种起始点计算方法得到了两组候选起始点序列之后，将该两种方法的结果相融合得到最终的起始点序列，具体方法为：比较该两种方法得到的序列N1、N2，若存在序列N1上的一点N1(i1)以及序列N2上的一点N2(i2)使得|N1(i1)-N2(i2)|＜σ，其中σ为一预定的值，则认为这两点来源于同一个音符端点，取两点的平均值作为最终的候选起始点存储，无法满足条件的点认为是可能存在的噪声造成的扰动，不计入起始点；

步骤5、以切分的音符为单位分析包含的基频，得到音符的频谱图，将得到的音符的频谱图和所述单音频谱模板相比较，相似度比较高的所述单音频谱模板即为音符内包含的基频；具体地，将所述步骤4中得到起始点的时间位置后，将相邻的两个起始点间的音频信号看作一个音符，以音符为单位分析基频情况，将两个起始点之间的所述恒Q变换的时频图取幅度后将不同时间帧的频谱取平均值得到所述音符的频谱图，与所述步骤1得到的单音频谱模板一一对比进行相似度比较，衡量相似度的方法采用巴氏距离，表达式为：

其中，

N为频率分量的总数，Q1、Q2分别表示待测音频信号和模板的恒Q变换谱图，m表示频率分量，当音符频谱与模板频谱相似度越高时求得的巴氏距离越短，比较后巴氏距离最短的结果对应的音高模板为音符的候选基频；

步骤6、按比例从所述音符的频谱中减去步骤5中已识别的基频，余下的频谱经过平滑后继续与所述单音频谱模板比较，找出可能存在的候选单音；重复上述过程直到减余的频谱低于预定的能量阈值为止。

2.如权利要求1所述的音符识别方法，其特征在于，所述步骤1中，所述恒Q变换的频率分辨率由Q值决定，计算公式如公式1：

其中，b为一个八度内所包含的频谱线数。

3.如权利要求2所述的音符识别方法，其特征在于，公式1中b＝60，即一个半音有5条频率分量。

4.如权利要求1所述的音符识别方法，其特征在于，所述步骤1中，将频谱中局部最大值频率附近相差2个频率分量点的幅值累加到局部最大值上，得到最终的模板。

5.如权利要求1所述的音符识别方法，其特征在于，所述步骤2中，使用麦克风阵列对电子琴弹奏音乐进行采集。

6.如权利要求1所述的音符识别方法，其特征在于，所述步骤3中，取每0.2s的采样点进行分析。

7.如权利要求1所述的音符识别方法，其特征在于，所述步骤3中，采用汉明窗。

8.如权利要求1所述的音符识别方法，其特征在于，所述步骤6中，找出步骤5中得到的候选基频的频谱模板中大于平均值的特征峰值p_m1、p_m2…对应的频率分量点m1、m2...，在所述音符的频谱中也找出这些频率点对应的峰值p₁、p₂…，则计算候选音高在音符中所占比例r的公式为：

根据计算结果按比例从所述音符的频谱中减去候选基频，余下的频谱图将可能存在的幅值小于0的位置置零的平滑处理后判断此时频谱的能量与未发生步骤6处理的频谱的能量相比是否低于预定的能量阈值，若否，则按照步骤5的方式继续寻找可能存在的基频，直到余下的频谱的能量低于预定的能量阈值，认为音符内候选基频的寻找已经完成，结束该音符内的基频查找运算。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011236049.9/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于恒Q变换的复调电子琴音乐音符识方法有效

专利文献下载