[发明专利]基于重音分析的人声转乐谱系统有效
申请号: | 201910192278.6 | 申请日: | 2019-03-14 |
公开(公告)号: | CN109979488B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 邱兆林;黄怡璠;刘洪甫;李灿晨;季俊涛;任宇凡;张克俊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L25/90 | 分类号: | G10L25/90;G10L25/18;G10H7/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 重音 分析 人声 乐谱 系统 | ||
1.一种基于重音分析的人声转乐谱系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机处理器执行所述计算机程序时实现以下步骤:
(1)对人声音频进行采样,获得多个样本片段,然后对每个样本片段进行频率分析;
(2)对每个样本片段进行重音分析,具体过程为:
首先,以每个样本片段中波形的平方和作为该样本片段的音量,根据音量和时间构建音量-时间变化曲线;
然后,计算音量-时间变化曲线相对于音量的离散导数,并以0.03秒对离散导数曲线进行采样获得采样点,分析音量的瞬间变化趋势,以变化剧烈的离散导数曲线对应的采样点作为重音的起始位置;
(3)根据重音分析结果和频率分析结果,对人声音频进行音符分割;
(4)获得每个音符后,根据频率变化,测定每个音符的音高;
(5)在获得每个音符的音高后,基于音高对乐谱进行调性分析和调整,以获得最终的乐谱。
2.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,对每个样本片段进行频率分析的具体方法为:
(a)将样本片段平均分成N份,考虑N份片段的N端点,并搜索寻找N个端点中自相关函数值的首次出现的极大值,或差值函数首次出现的极小值所在的那个片段;
(b)以该片段作为输入,按照步骤(a)再进行迭代搜索寻找,直到确定极值点为止;
(c)相邻两个极值点之间的距离即为波长,波长的倒数即为频率,以此获得每个样本片段的频率分析结果。
3.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,在获得重音后,根据这些重音的起始位置以及重音的持续时间,即初步计算形成乐曲速度。
4.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,根据重音分析结果和频率分析结果,对人声音频进行音符分割的具体过程为:
首先,对频率变化和音量变化赋予不同权重后,计算音符的把握度:
c(t)=wf×δ(f,t)+wv×δ(v,t)
其中,c(t)表示t时刻音符的把握度,δ(f,t)是频率f相对于时间t的变化函数,δ(v,t)是音量v相对于时间t的变化函数,wf为函数δ(f,t)的权重,wv为函数δ(v,t)的权重,且wfwv;
然后,当音符的把握度大于阈值时,则在此时刻认为是音符开始的位置,即对音符进行分割。
5.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,根据重音分析结果和频率分析结果以及乐曲速度,对人声音频进行音符分割,具体过程为:
首先,对频率变化、音量变化以及乐曲速度赋予不同权重后,计算音符的把握度:
c(t)=wf×δ(f,t)+wv×δ(v,t)+wBPM×b(t,BPM)
其中,wBPM表示函数b(t,BPM)的权重,b(t,BPM)表示根据乐曲速度计算节拍信息的函数,t时刻越接近整拍则函数值越大,δ(f,t)是频率f相对于时间t的变化函数,δ(v,t)是音量v相对于时间t的变化函数,wf为函数δ(f,t)的权重,wv为函数δ(v,t)的权重,且wfwv;
然后,当音符的把握度大于阈值时,则在此时刻认为是音符开始的位置,即对音符进行分割。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910192278.6/1.html,转载请声明来源钻瓜专利网。