[发明专利]一种基于动态时间规整的哼唱音准评价方法有效
申请号: | 202210332565.4 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114758560B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 吴清强;黄泽斌;姚俊峰;曾祥健;刘震;仁望龙 | 申请(专利权)人: | 厦门大学 |
主分类号: | G09B15/00 | 分类号: | G09B15/00;G10L25/51 |
代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 朱凌 |
地址: | 361000 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 时间 规整 哼唱 音准 评价 方法 | ||
1.一种基于动态时间规整的哼唱音准评价方法,其特征在于:包括如下步骤:
步骤S10、获取大量的哼唱数据,并对各所述哼唱数据进行预处理;
步骤S20、提取预处理后的所述哼唱数据中的音频特征;
步骤S30、对各所述音频特征进行预处理;
步骤S40、基于动态时间规整算法创建一音准评价模型,利用预处理后的所述音频特征对音准评价模型进行训练;
步骤S50、利用训练后的所述音准评价模型对待评价音频进行评价,生成评价结果;
所述步骤S20具体包括:
步骤S21、预判预处理后的所述哼唱数据的音频时长是否短于预设的实际时长,若否,说明不存在漏唱,进入步骤S22;若是,说明存在漏唱,进入步骤S23;
步骤S22、利用Python编程语言提取所述哼唱数据中每一个字出现的时间点,基于各所述时间点将哼唱数据分割为若干个第一音频片段,利用Python编程语言的依赖库提取各所述第一音频片段的频率并求取第一平均值,将所述第一平均值作为音频特征;
步骤S23、利用Python编程语言的依赖库对所述哼唱数据进行分帧,以一帧为单位将所述哼唱数据分割为若干个第二音频片段,利用依赖库提取各所述第二音频片段的频率并求取第二平均值,将所述第二平均值作为音频特征;
所述步骤S40中,所述音准评价模型用于求取音频特征与标准频率之间的最优路径和距离矩阵,基于拟合函数对所述最优路径上的频率值进行拟合得到拟合值,将各所述拟合值求取第三平均值作为音准值;
基于专家评分对所述音准值进行误差计算得到误差值,基于所述误差值进行再次拟合,直至所述误差值满足预设的收敛条件;
所述步骤S50具体为:
对待评价音频进行预处理后提取待评价音频特征,对各所述待评价音频特征进行预处理后输入训练后的音准评价模型,生成包括若干个音频片段、对应音准值以及总音准值的评价结果,并输出显示所述评价结果。
2.如权利要求1所述的一种基于动态时间规整的哼唱音准评价方法,其特征在于:所述步骤S10具体为:
获取大量的哼唱数据,并对各所述哼唱数据依次进行格式转换、去除伴奏、去除首尾无声段以及降噪的预处理。
3.如权利要求2所述的一种基于动态时间规整的哼唱音准评价方法,其特征在于:所述格式转换具体为:转换为wav格式,并设定音频采样率为44100、声道数为2。
4.如权利要求1所述的一种基于动态时间规整的哼唱音准评价方法,其特征在于:所述步骤S30具体为:
将各所述音频特征与对应的标准频率进行做差比较,进而对各所述音频特征进行音高标记,进而完成各所述音频特征的预处理。
5.如权利要求4所述的一种基于动态时间规整的哼唱音准评价方法,其特征在于:所述音高为高八度或者低八度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210332565.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对甘薯小象甲进行RNAi的方法及装置
- 下一篇:一种钢丝绳扭力释放器