[发明专利]主旋律音高序列估计方法有效

专利信息
申请号: 201810390549.4 申请日: 2018-04-27
公开(公告)号: CN108735231B 公开(公告)日: 2021-11-12
发明(设计)人: 张维维;陈喆;殷福亮;许小可 申请(专利权)人: 大连民族大学
主分类号: G10L25/54 分类号: G10L25/54;G10L25/90;G06F16/68;G06F16/635
代理公司: 大连智高专利事务所(特殊普通合伙) 21235 代理人: 刘斌
地址: 116600 辽宁省*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 主旋律 音高 序列 估计 方法
【说明书】:

主旋律音高序列估计方法,属于音乐信息检索领域,为了解决降低短时强伴奏的影响及八度误差的问题,要点是将每帧主旋律音高序列平滑估计值的上下八度范围作为该帧的主旋律音高的搜索范围,效果是将每个频率点的显著度值定义为各次谐波分量幅度的加权和,进一步降低了八度误差。

技术领域

发明属于音乐信息检索领域,涉及一种主旋律音高序列估计方法。

背景技术

音乐信息检索领域中的主旋律提取即从音乐信号中估计出主旋律音高序列,其主要依据是音乐中主旋律成分的显著性和时序连续性。传统的主旋律提取方法大多把主旋律提取问题分解成多音高估计和旋律轮廓构建两个子问题,导致无法同时兼顾两个特性,在多音高估计阶段没有考虑到连续帧音高的高度相关性。Jo等提出采用贝叶斯滤波框架建模主旋律提取问题,并借助粒子滤波方法估计参数,但该方法在粒子滤波之前仍然需要进行多音高估计,且具有较多的参数需要估计(S.Jo,C.D.Yoo,and A.Doucet,Melody trackingbased on sequential Bayesian model,IEEE Journal of Selected Topics in SignalProcessing,2011,5(6):1216–1227.)。

此外,音乐信号非常复杂,具有典型非平稳性的本质特点,即某些短时强伴奏音功率可能超过主旋律成分,且主旋律音高频率分布较广,包含几个八度范围,导致现有方案在主旋律提取中来自于伴奏音的错误音高和八度误差广泛存在。

发明内容

为了解决降低短时强伴奏的影响及八度误差的问题,本发明提出如下方案:一种主旋律音高序列估计方法,包括如下步骤:

(1)将每帧主旋律音高序列平滑估计值的上下八度范围作为该帧的主旋律音高的搜索范围;

(2)计算每帧主旋律音高搜索范围内每个频率点的显著度值S′t(f):

其中Nh=10是最大谐波次数,|Xt(hf)|为频率f的第h次谐波幅度;

(3)对每帧的S′t(f)进行归一化,得到St(f):

(4)利用动态规划算法得到最终的主旋律音高序列值,动态规划的初始条件为:

D(1,ft,j)=S1(fj) (11)

其中D(t,ft,j)是第t帧取ft,j作为旋律音高的累积代价函数,S1(fj)由公式(10)得到,是第1帧的显著度函数在第j个频点的取值,则求解主旋律音高序列最优解的递归公式为:

D(t,ft,j)=St(fj)+max{D(t-1,ft-1,k)-λd(ft-1,k,ft,j)},t=1,...,Nfrm (12)

其中ft,j为第t帧主旋律音高的可能值,ft-1,k为第t-1帧主旋律音高估计值,d(ft-1,k,ft,j)为ft-1,k和ft,j的半音差,λ为惩罚因子;

不断迭代公式(12)得到最终主旋律音高序列估计。

作为技术方案的补充,λ=0.05。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810390549.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top