[发明专利]主旋律音高序列估计方法有效
申请号: | 201810390549.4 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108735231B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 张维维;陈喆;殷福亮;许小可 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G10L25/90;G06F16/68;G06F16/635 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘斌 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主旋律 音高 序列 估计 方法 | ||
主旋律音高序列估计方法,属于音乐信息检索领域,为了解决降低短时强伴奏的影响及八度误差的问题,要点是将每帧主旋律音高序列平滑估计值的上下八度范围作为该帧的主旋律音高的搜索范围,效果是将每个频率点的显著度值定义为各次谐波分量幅度的加权和,进一步降低了八度误差。
技术领域
本发明属于音乐信息检索领域,涉及一种主旋律音高序列估计方法。
背景技术
音乐信息检索领域中的主旋律提取即从音乐信号中估计出主旋律音高序列,其主要依据是音乐中主旋律成分的显著性和时序连续性。传统的主旋律提取方法大多把主旋律提取问题分解成多音高估计和旋律轮廓构建两个子问题,导致无法同时兼顾两个特性,在多音高估计阶段没有考虑到连续帧音高的高度相关性。Jo等提出采用贝叶斯滤波框架建模主旋律提取问题,并借助粒子滤波方法估计参数,但该方法在粒子滤波之前仍然需要进行多音高估计,且具有较多的参数需要估计(S.Jo,C.D.Yoo,and A.Doucet,Melody trackingbased on sequential Bayesian model,IEEE Journal of Selected Topics in SignalProcessing,2011,5(6):1216–1227.)。
此外,音乐信号非常复杂,具有典型非平稳性的本质特点,即某些短时强伴奏音功率可能超过主旋律成分,且主旋律音高频率分布较广,包含几个八度范围,导致现有方案在主旋律提取中来自于伴奏音的错误音高和八度误差广泛存在。
发明内容
为了解决降低短时强伴奏的影响及八度误差的问题,本发明提出如下方案:一种主旋律音高序列估计方法,包括如下步骤:
(1)将每帧主旋律音高序列平滑估计值的上下八度范围作为该帧的主旋律音高的搜索范围;
(2)计算每帧主旋律音高搜索范围内每个频率点的显著度值S′t(f):
其中Nh=10是最大谐波次数,|Xt(hf)|为频率f的第h次谐波幅度;
(3)对每帧的S′t(f)进行归一化,得到St(f):
(4)利用动态规划算法得到最终的主旋律音高序列值,动态规划的初始条件为:
D(1,ft,j)=S1(fj) (11)
其中D(t,ft,j)是第t帧取ft,j作为旋律音高的累积代价函数,S1(fj)由公式(10)得到,是第1帧的显著度函数在第j个频点的取值,则求解主旋律音高序列最优解的递归公式为:
D(t,ft,j)=St(fj)+max{D(t-1,ft-1,k)-λd(ft-1,k,ft,j)},t=1,...,Nfrm (12)
其中ft,j为第t帧主旋律音高的可能值,ft-1,k为第t-1帧主旋律音高估计值,d(ft-1,k,ft,j)为ft-1,k和ft,j的半音差,λ为惩罚因子;
不断迭代公式(12)得到最终主旋律音高序列估计。
作为技术方案的补充,λ=0.05。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810390549.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于混合音频的背景音乐识别方法、装置及设备
- 下一篇:一种性格识别方法和装置