[发明专利]一种乐音数据的采集和特征识别方法在审
申请号: | 202111110111.4 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113889058A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 孙梦青 | 申请(专利权)人: | 华北水利水电大学 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G06F17/14 |
代理公司: | 郑州浩德知识产权代理事务所(普通合伙) 41130 | 代理人: | 柏琼琼 |
地址: | 450045 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 乐音 数据 采集 特征 识别 方法 | ||
1.一种乐音数据的采集和特征识别方法,其特征在于,包括以下步骤:
步骤一:基于已有的高品质数字音乐文件库,提取时频域信号特征,评估并确定已知乐音识别的关键采集信息元,自动分割乐音数据并分解时频域乐音信息,构建声学-统计学-效应的分层映射模型,对电子乐音数据的旋律特征进行统计构建已知特征矢量矩阵,建立特征矢量空间;
步骤二:构建评价指标体系,确立乐音识别的关键信息元;
步骤三:对目标乐音进行预处理和时频域分解,提取目标乐音的关键信息并与步骤二中的关键信息元组成关键信息集;
步骤四:通过确立乐音识别的关键信息集构建乐音的目标特征矢量矩阵;
步骤五:将构建乐音的目标特征矢量矩阵,置于已知数字音乐库的特征矢量空间中进行距离计算和匹配得出特征矢量空间距离和匹配结果。
2.根据权利要求1所述的一种乐音数据的采集和特征识别方法,其特征在于:在步骤一中,电子乐音数据的所述旋律特征的波形函数为:
令Y(jω)为离散时间信号y(n)的DFT变换,则有:
Y(jω)=Si(jω)·Fi(jω)
其中,ωi为指定音的基频或倍频,Ai为基频点或倍频点的振幅,αi用来调节基频或者倍频附近波形宽度,Fi为关于正弦和余弦的函数;
对此建立矩阵,记录乐音各倍频点的相对振幅比例关系,把振动总能量按相对振幅的比例分配到各倍频点上,频率的记录矩阵就作为一种特征矢量,成为组成特征矢量空间的一个维度。
3.根据权利要求1所述的一种乐音数据的采集和特征识别方法,其特征在于:在步骤二中针对基音、泛音、响度、速度等乐音的关键信息进行系统分析,构建评价指标体系,建立乐音识别的关键信息元。
4.根据权利要求1所述的一种乐音数据的采集和特征识别方法,其特征在于:在步骤三中,对目标乐音进行预处理和时频域分解,采用分析时间轴的乐音信号,包括波形归一处理、端点检测、单音符分隔,其中将乐音进行分割离散化得到音符,在CQT频谱上构造有效的检测函数,利用检测函数的峰值来确定音符起始点的位置,检测函数的构造应用了幅度与相位联合判别的思想,在复数域进行构建:
CQT频谱在时间t和谱线k处的谱值x[t,k]可以写作复数:
其中,ψ(t,k)在(-π,π)区间,是x[t,k]的相位;
构造检测函数DF(t)满足:
其中,Nb为频率谱线分量数。此检测函数联合能量与相位属性来考察候选起始点,配合自适应函数阈值δ[t],利用一定范围内的加权中值来筛选出真正的峰值作为音符起始点。
δ[t]=δ0+λ·Median(DF(t-t1),...,DF(t+t2)),其中t1,t2,δ0,λ为可变常数,Median()为取中值;
在进行复数域构建后,乐音信号的频域特征的处理方式采用滤波去噪、频带限制、频率检测,利用快速傅里叶变换FFT消除高频噪声,利用高通滤波器H(ω)构造多辨分析MRA,将时变信号分解为j个尺度的分量的正交和,以Daubechies-4阶小波进行采样分解。
5.根据权利要求3或4所述的一种乐音数据的采集和特征识别方法,其特征在于:在步骤四中,通过步骤二得到乐音的诸个关键信息元结合步骤三中对目标乐音进行预处理和时频域分解后提取目标乐音的关键信息,运用模糊综合评价技术和AHP分析法,对乐音信息的关键性进行定权排序,基于定权排序的结论,构建关键信息元的遴选和关键信息集。
6.根据权利要求1或2所述的一种乐音数据的采集和特征识别方法,其特征在于:在步骤四中,利用目标乐音的旋律特征的波形函数建立目标矢量矩阵。
7.根据权利要求1或4所述的一种乐音数据的采集和特征识别方法,其特征在于:在步骤五中,在进行距离计算和匹配时,是基于听觉显著度特征开展旋律流的检测、提取和识别,对于t时刻的各个子带,经过CQT变换、各子带数据建模、时序贝叶斯推断、子带AS特征分量计算后利用TANN网络识别出听觉显著度明显的多个子带作为候选半音,形成一个显著的半音复合结构;半音复合结构随着时间的变化组成了时间序列,形成了候选旋律流,在得到初步的旋律流后,衍生广义和弦结构的先验知识可规范候选旋律流中每一时刻的类和弦结构,所以先验知识与TANN网络输出的候选旋律流作融合,提取得到最终旋律流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北水利水电大学,未经华北水利水电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111110111.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置