[发明专利]音乐主旋律提取系统有效
申请号: | 201810390420.3 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108595648B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 张维维;陈喆;殷福亮 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/635 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘斌 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 主旋律 提取 系统 | ||
音乐主旋律提取系统,属于音乐信息检索领域,为了解决主旋律提取方法中提高音高估计准确性的问题,要点是存储有多条指令,所述指令适于处理器加载并执行:计算音乐信号的常Q变换;计算基于粒子滤波的主旋律音高序列的粗略估计;计算主旋律音高序列平滑估计序列;计算最终主旋律音高序列估计,效果是提高了旋律提取准确性。
技术领域
本发明属于音乐信息检索领域,涉及一种音乐主旋律提取系统。
背景技术
音乐信息检索领域中的主旋律提取即从音乐信号中估计出主旋律音高序列,其主要依据是音乐中主旋律成分的显著性和时序连续性。传统的主旋律提取方法大多把主旋律提取问题分解成多音高估计和旋律轮廓构建两个子问题,导致无法同时兼顾两个特性,在多音高估计阶段没有考虑到连续帧音高的高度相关性。Jo等提出采用贝叶斯滤波框架建模主旋律提取问题,并借助粒子滤波方法估计参数,但该方法在粒子滤波之前仍然需要进行多音高估计,且具有较多的参数需要估计(S.Jo,C.D.Yoo,and A.Doucet,Melody trackingbased on sequential Bayesian model,IEEE Journal of Selected Topics in SignalProcessing,2011,5(6):1216–1227.)。
此外,音乐信号非常复杂,具有典型非平稳性的本质特点,即某些短时强伴奏音功率可能超过主旋律成分,且主旋律音高频率分布较广,包含几个八度范围,导致现有方案在主旋律提取中来自于伴奏音的错误音高和八度误差广泛存在。
发明内容
为了解决主旋律提取方法中提高音高估计准确性的问题,本发明提出如下方案:
为了解决降低短时强伴奏的影响及八度误差的问题,本发明提出如下方案:
一种音乐主旋律提取系统,存储有多条指令,所述指令适于处理器加载并执行:
计算音乐信号的常Q变换;
计算基于粒子滤波的主旋律音高序列的粗略估计;
计算主旋律音高序列平滑估计序列;
计算最终主旋律音高序列估计。
作为技术方案的补充,计算音乐信号的常Q变换基于如下方式实现:对非平稳的音乐信号进行分帧,然后利用常Q变换计算按照对数分布的各频率点的幅度值,每八度范围具有36个按对数分布的频率点。
作为技术方案的补充,计算基于粒子滤波的主旋律音高序列的粗略估计基于如下方式实现:
初始化:其中表示第i个粒子的初始音高服从[110Hz,1200Hz]范围内均匀分布,Np为粒子数,表示第i个粒子权重;
迭代求解:
(1)按转移概率,预测第t帧旋律音高频率:
根据实际音乐中音高转移概率统计分析结果,将音高转移概率建模为logistic分布,其概率密度函数为:
其中x=f0,t/f0,t-1,f0,t为第t帧旋律音高频率,且μ=1.00003,s=0.0055045。
(2)计算粒子权重
其中P和S分别代表了第t帧第i个粒子的功率和谐波平滑性因子,分别定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810390420.3/2.html,转载请声明来源钻瓜专利网。