[发明专利]一种敲击弦乐器的音乐多音符估计方法及系统有效

申请号：	201410325609.6	申请日：	2014-07-09
公开（公告）号：	CN105304073B	公开（公告）日：	2019-03-12
发明（设计）人：	周若华;万玉龙;颜永红;王宪亮	申请（专利权）人：	中国科学院声学研究所;北京中科信利技术有限公司
主分类号：	G10H3/12	分类号：	G10H3/12;G10H1/00;G10L25/27
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	王宇杨;吕爱霞
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于非负矩阵分解的敲击弦乐器的音乐多音符估计方法，该方法利用敲击弦乐器的单音音频数据构建音符能量谱包络基矩阵，通过对多音能量谱包络的非负矩阵分解，求得各音符在多音片段中的能量权重系数，最后对音符权重大小进行阈值限定求得多音片段中的多音符分布。与传统方法比较，基于非负矩阵分解的音乐多音符估计方法只利用了音符起始点处的能量谱包络信息，同时结合了能量谱包络的线性叠加性来分解能量谱，符合局部构建整体的音符叠加机理，多音符估计性能得到明显提升，同时系统速度也有一定提升，具有很高的实用性。
搜索关键词：	一种敲击弦乐器音乐多音估计方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种敲击弦乐器的音乐多音符估计方法，所述方法包含：步骤101)利用单音片段构建单音能量谱包络基矩阵；步骤102)根据得到的单音片段的单音能量谱包络基矩阵，将基于待识别的多音片段得到的归一化的平均能量谱通过非负矩阵分解算法进行音符结果估计，判断待识别的多音片段中存在的单音符情况；所述步骤102)进一步包含：步骤102‑1)通过RTFI时频分析方法，采用如下公式(4)求得待识别的多音片段的平均能量谱在第m个频率分析点处的大小PAEE(m)，并对得到的PAEE(m)采用如下公式(5)进行能量归一化处理得到PAEE′(m)，由此得到归一化的多音片段的平均能量谱PAEE；PAEE＝{PAEE′(1),PAEE′(2),…PAEE′(M)}其中，i表示帧索引，m表示频率分析点索引，PAES(i,m)表示多音片段的平均能量谱在第i帧第m个频率分析点处的大小，Ncfm表示用于计算能量谱的总帧数，M为频率分析点总数；步骤102‑2)基于归一化的多音片段的平均能量谱PAEE和单音能量谱包络基矩阵AEEB，采用如下公式求解得到每个音符在多音片段中的单音符权重系数序列W：PAEE＝AEEB×W (6)步骤102‑3)对得到的单音符权重系数序列W进行阈值判定；当一个单音符的权重大小超过设定的阈值时，则判定在多音片段中存在该单音符；所述非负矩阵分解算法具体包含如下步骤：204‑1)采用单位矩阵初始化单音符权重系数序列W；204‑2)根据单音能量谱包络基矩阵AEEB和单音符权重系数序列W重构第一矩阵204‑3)计算待识别的多音片段的平均能量谱PAEE同第一矩阵的距离，得到第一距离具体计算公式为：其中，i表示频率分析点，M为频率分析点总数，Dist{,}表示PAEE同第一矩阵的距离；204‑4)启动迭代步骤，进而将得到的多音片段的平均能量谱分解为单音能量谱包络基矩阵与一个单音符权重系数序列的乘积；该步骤具体包含：将迭代次数变量iter赋初值1，同时设定一个整数Mc且Mc为大于1的整数并设定迭代次数上限为Z；步骤204‑4‑1)判定iter当前的值是否小于等于设定的上限次数Z，如果当前iter的值小于等于上限次数Z则进入步骤204‑4‑2)，否则迭代停止；步骤204‑4‑2)采用如下公式(8)更新单音符权重系数序列：其中，等号左边的单音符权重系数序列为更新后的，等号右边的单音符权重系数序列为更新前的；步骤204‑4‑2‑1)计算当前iter的值与M_c的商，如果能够整除，则采用如下公式(9)更新第二矩阵否则进入步骤204‑4‑2‑7)：步骤204‑4‑2‑2)根据公式(10)计算第一矩阵和第二矩阵的矩阵偏差和并将矩阵偏差和作为第一判决值：步骤204‑4‑2‑3)更新第一矩阵即将当前第二矩阵的值赋予第一矩阵步骤204‑4‑2‑4)计算待识别的多音片段的平均能量谱PAEE同当前第二矩阵的矩阵距离将作为第二距离，计算公式如公式(11)所示：步骤204‑4‑2‑5))计算待识别的多音片段的平均能量谱PAEE同第二矩阵的矩阵偏差比率并将矩阵偏差比率作为第二判决值，计算公式如公式(12)所示：步骤204‑4‑2‑6)计算第二距离与第一距离的差值，并计算该差值与整数Mc的商，将商作为第三判决值；步骤204‑4‑2‑7)基于第一判决值，第二判决值和第三判决值分别进行如下判决，当满足以下三个判决条件中的任意一个判决条件时，则迭代停止，否则执行步骤204‑4‑2‑8)：其中，Rthres，Dthres和Ethres分别为设定的控制迭代停止的阈值；步骤204‑4‑2‑8)将第二距离的值赋予第一距离；采用如下公式(13)更新迭代次数iter的值，然后返回步骤204‑4‑1)，直至迭代结束；iter＝iter+1 (13)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司，未经中国科学院声学研究所;北京中科信利技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410325609.6/，转载请声明来源钻瓜专利网。

上一篇：一种多方通话的多模式语音合成方法与系统以及服务器
下一篇：液晶显示屏的色度调节方法和装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10H 电声乐器；由机电装置或电子发生器产生音调的乐器，或从数据存储器合成音调的乐器
G10H3-00 其中由机电装置产生音调的乐器
G10H3-02 .应用机械断续器的
G10H3-03 .应用拾音装置读出记录的声波的，例如在转盘上
G10H3-12 .应用机械共振发生器的，例如弦乐器或打击乐器，用机电传感器拾取它的音调，而其电信号则被进一步处理或放大，然后通过扬声器或等效的设备将它变换成声音
G10H3-14 ..应用机械驱动的带有拾音器的振动器的
G10H3-22 ..应用机电驱动的带有拾音器的振动器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种敲击弦乐器的音乐多音符估计方法及系统有效

专利文献下载