[发明专利]一种敲击弦乐器的音乐多音符估计方法及系统有效
申请号: | 201410325609.6 | 申请日: | 2014-07-09 |
公开(公告)号: | CN105304073B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 周若华;万玉龙;颜永红;王宪亮 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10H3/12 | 分类号: | G10H3/12;G10H1/00;G10L25/27 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;吕爱霞 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于非负矩阵分解的敲击弦乐器的音乐多音符估计方法,该方法利用敲击弦乐器的单音音频数据构建音符能量谱包络基矩阵,通过对多音能量谱包络的非负矩阵分解,求得各音符在多音片段中的能量权重系数,最后对音符权重大小进行阈值限定求得多音片段中的多音符分布。与传统方法比较,基于非负矩阵分解的音乐多音符估计方法只利用了音符起始点处的能量谱包络信息,同时结合了能量谱包络的线性叠加性来分解能量谱,符合局部构建整体的音符叠加机理,多音符估计性能得到明显提升,同时系统速度也有一定提升,具有很高的实用性。 | ||
搜索关键词: | 一种 敲击 弦乐器 音乐 多音 估计 方法 系统 | ||
【主权项】:
1.一种敲击弦乐器的音乐多音符估计方法,所述方法包含:步骤101)利用单音片段构建单音能量谱包络基矩阵;步骤102)根据得到的单音片段的单音能量谱包络基矩阵,将基于待识别的多音片段得到的归一化的平均能量谱通过非负矩阵分解算法进行音符结果估计,判断待识别的多音片段中存在的单音符情况;所述步骤102)进一步包含:步骤102‑1)通过RTFI时频分析方法,采用如下公式(4)求得待识别的多音片段的平均能量谱在第m个频率分析点处的大小PAEE(m),并对得到的PAEE(m)采用如下公式(5)进行能量归一化处理得到PAEE′(m),由此得到归一化的多音片段的平均能量谱PAEE;![]()
PAEE={PAEE′(1),PAEE′(2),…PAEE′(M)}其中,i表示帧索引,m表示频率分析点索引,PAES(i,m)表示多音片段的平均能量谱在第i帧第m个频率分析点处的大小,Ncfm表示用于计算能量谱的总帧数,M为频率分析点总数;步骤102‑2)基于归一化的多音片段的平均能量谱PAEE和单音能量谱包络基矩阵AEEB,采用如下公式求解得到每个音符在多音片段中的单音符权重系数序列W:PAEE=AEEB×W (6)步骤102‑3)对得到的单音符权重系数序列W进行阈值判定;当一个单音符的权重大小超过设定的阈值时,则判定在多音片段中存在该单音符;所述非负矩阵分解算法具体包含如下步骤:204‑1)采用单位矩阵初始化单音符权重系数序列W;204‑2)根据单音能量谱包络基矩阵AEEB和单音符权重系数序列W重构第一矩阵
204‑3)计算待识别的多音片段的平均能量谱PAEE同第一矩阵
的距离,得到第一距离
具体计算公式为:
其中,i表示频率分析点,M为频率分析点总数,Dist{,}表示PAEE同第一矩阵
的距离;204‑4)启动迭代步骤,进而将得到的多音片段的平均能量谱分解为单音能量谱包络基矩阵与一个单音符权重系数序列的乘积;该步骤具体包含:将迭代次数变量iter赋初值1,同时设定一个整数Mc且Mc为大于1的整数并设定迭代次数上限为Z;步骤204‑4‑1)判定iter当前的值是否小于等于设定的上限次数Z,如果当前iter的值小于等于上限次数Z则进入步骤204‑4‑2),否则迭代停止;步骤204‑4‑2)采用如下公式(8)更新单音符权重系数序列:
其中,等号左边的单音符权重系数序列为更新后的,等号右边的单音符权重系数序列为更新前的;步骤204‑4‑2‑1)计算当前iter的值与Mc的商,如果能够整除,则采用如下公式(9)更新第二矩阵
否则进入步骤204‑4‑2‑7):
步骤204‑4‑2‑2)根据公式(10)计算第一矩阵和第二矩阵的矩阵偏差和
并将矩阵偏差和
作为第一判决值:
步骤204‑4‑2‑3)更新第一矩阵
即将当前第二矩阵
的值赋予第一矩阵
步骤204‑4‑2‑4)计算待识别的多音片段的平均能量谱PAEE同当前第二矩阵
的矩阵距离
将
作为第二距离,计算公式如公式(11)所示:
步骤204‑4‑2‑5))计算待识别的多音片段的平均能量谱PAEE同第二矩阵
的矩阵偏差比率
并将矩阵偏差比率
作为第二判决值,计算公式如公式(12)所示:
步骤204‑4‑2‑6)计算第二距离与第一距离的差值,并计算该差值与整数Mc的商,将商作为第三判决值;步骤204‑4‑2‑7)基于第一判决值,第二判决值和第三判决值分别进行如下判决,当满足以下三个判决条件中的任意一个判决条件时,则迭代停止,否则执行步骤204‑4‑2‑8):![]()
![]()
其中,Rthres,Dthres和Ethres分别为设定的控制迭代停止的阈值;步骤204‑4‑2‑8)将第二距离的值赋予第一距离;采用如下公式(13)更新迭代次数iter的值,然后返回步骤204‑4‑1),直至迭代结束;iter=iter+1 (13)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410325609.6/,转载请声明来源钻瓜专利网。