[发明专利]单声道多音音乐信号的自动转录方法及装置有效
申请号: | 201210516769.X | 申请日: | 2012-12-05 |
公开(公告)号: | CN103854644A | 公开(公告)日: | 2014-06-11 |
发明(设计)人: | 王晖;王雨田;朱兵;王颖;宫妍竹 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;曲鹏 |
地址: | 100024 北京市朝阳区定*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单声道 多音 音乐 信号 自动 转录 方法 装置 | ||
技术领域
本发明涉及数字信号处理技术领域,尤其涉及一种单声道多音音乐信号的自动转录方法及装置。
背景技术
随着数字信号处理技术的进步,音乐信号的传播及保存方式也变得多样化。一段音乐信号的乐谱几乎包含了乐曲中的所有信息,包括旋律、节奏、节拍等。利用某些音频软件,甚至可以通过对乐谱的创作或修改,不需真实乐器演奏就可以生成新的音乐信号。如果计算机能够自动从时域音乐信号中得到乐谱,那么对于音乐的进一步发展将有着非常重要的意义。
随着音乐信号处理技术的发展,产生了多种音乐信号自动转录装置。但目前存在的音乐信号自动转录装置都存在着各自的局限性。例如,有些装置只针对乐器数字接口(MIDI)格式的音乐信号,然而众所周知,MIDI信号中包含了很丰富的乐谱信息,从MIDI格式的音乐信号中提取乐谱只是一种逻辑转换,并不包含音符识别或节奏提取等具体工作;有些装置只针对单音音乐信号,即音乐信号在任何一个时间点只有不超过一个音符存在,当这些装置面对多音音乐的输入信号,就会失去原有的功能。有些装置可以对多音音乐信号进行乐谱的自动转录,但由于多音信号自身的复杂性及装置的特性,会造成乐谱信息的不准确。
因此,针对不包含乐谱信息的音乐格式(如wav格式)的多音音乐信号进行高质量的乐谱的自动转录的装置是合乎需要的。
发明内容
本发明提供了一种单声道多音音乐信号的自动转录方法及装置,以解决现有的自动转录装置无法针对多音音乐信号进行转录或乐谱准确率不高的问题。
本发明提供了一种单声道多音音乐信号的自动转录方法,该方法包括:
接收单通道多音音乐信号;
对所述单声道多音音乐信号进行分离,得到多路单音音乐信号;
对各路单音音乐信号进行音色提取,确定演奏乐器信息;
对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及
根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。
优选地,所述对单声道多音音乐信号进行分离,得到多路单音音乐信号,包括:
将多音音乐信号进行分帧处理,获得多个音频帧,对各音频帧进行静音检测确定是否为静音帧,对每一非静音帧进行多基频检测,获得音符信息和基频检测值;对不同音符进行谐波数及幅度的估计,获得各音符的幅度和谐波信息,依据贝叶斯谐波模型,利用所述基频估计值,获得时域分音信号;依据预设的帧移及帧数,逐帧对时域分音信号进行合成;或者
所述对各路单音音乐信号进行音色提取,确定演奏乐器信息,包括:
将各路单音音乐信号分帧,将各帧单音音乐信号进行转换,得到各单音信号的内禀模态函数集合;利用非线性音色模型,提取各帧单音音乐信号的模型参数;将获得的模型参数与预存数据进行对比,判断演奏各路单音音乐信号的乐器信息;或者
所述对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息,包括:
将各路单音音乐信号分帧,按照启发式规则和各帧单音音乐信号频谱峰值信息,进行基频检测,得到音高和对应音符;将各帧单音音乐信号归一化,得到一阶差分包络,利用能量突起进行音符起始点检测;对差分后的边沿信号进行处理,得到其自相关信号和自相关相位熵序列,利用二者信息计算节拍检测待检信号;对音符起始点序列进行处理,根据音乐速度范围和音符之间关系将音符节拍分类,并利用各类在待检信号的峰值找出节拍长度作为候选节拍;选取不同的检测起点和节拍值,对整首音乐进行设定权值的多路径跟踪,得到与开始音符匹配的节拍值及节拍起始位置和各个节拍的位置。
优选地,所述对每一非静音帧进行多基频检测,获得音符信息和基频检测值,包括:
对每一非静音帧,通过短时傅里叶变换(STFT),获得对应的频谱;在对应的频谱中,提取波峰位置及其对应幅度;按照启发式规则和已提取的波峰位置及其对应幅度进行多基频检测,获得多个音符信息;对相互之间没有倍数关系的基频进行估计,获得第一估计值,对相互之间有倍数关系的基频进行估计,获得第二估计值,根据所述第一估计值和所述第二估计值获得基频估计值;或者
所述非线性音色模型为基于正弦频率调制的非线性音色模型,该基于正弦频率调制的非线性音色模型为:
其中,Ai是第i个调频分量的幅度,ωi为载波频率,为第i个调频分量的第j个调频系数,R为残余分量。
本发明还提供了一种单声道多音音乐信号的自动转录装置,该装置包括:
音频信号接收单元,用于接收单通道多音音乐信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210516769.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无强制对流冷却的包含磁控管的微波驱动无电极灯
- 下一篇:梯子