[发明专利]一种基于片段式的多阶段自动音准评分方法在审
申请号: | 202310176329.2 | 申请日: | 2023-02-28 |
公开(公告)号: | CN116246598A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 黄泽斌;吴清强;曾祥健;徐民洪;黄仙寿 | 申请(专利权)人: | 厦门大学 |
主分类号: | G10H1/40 | 分类号: | G10H1/40;G10L25/51;G10L25/03;G10L21/0208 |
代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 朱凌 |
地址: | 361000 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 段式 阶段 自动 音准 评分 方法 | ||
1.一种基于片段式的多阶段自动音准评分方法,其特征在于:包括如下步骤:
步骤S10、获取待评分的音频数据以及曲谱数据;
步骤S20、对所述音频数据进行有无歌声的校验;
步骤S30、通过深度学习模型对所述音频数据进行降噪处理;
步骤S40、剔除所述音频数据的非歌唱段;
步骤S50、检测所述音频数据中各音符的音符时间点;
步骤S60、基于各所述音符时间点提取音频数据的音频特征,并对所述曲谱数据进行整理得到曲谱文件;
步骤S70、基于所述曲谱文件和音频特征对音频数据进行自动评分,生成并展示评分结果。
2.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S10具体为:
获取待评分的音频数据以及所述音频数据对应的曲谱数据。
3.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S20具体为:
通过python依赖库提取所述音频数据的第一频率,将提取的所述第一频率转换为第一音高值序列,测量所述第一音高值序列的长度A、测量去除空值后的所述第一音高值序列的长度B,判断B/A是否大于0.21,若是,说明所述音频数据存在歌声,并进入步骤S30;若否,说明所述音频数据不存在歌声,生成并展示0分的评分结果,并结束流程。
4.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S30具体为:
通过Demucs模型对所述音频数据进行一次降噪处理后,再通过Spleeter模型对所述音频数据进行二次降噪处理。
5.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S40具体包括:
步骤S41、通过深度学习模型检测所述音频数据的第一起唱时间点;
步骤S42、通过传统算法模型检测所述音频数据的第二起唱时间点;
步骤S43、基于所述第一起唱时间点和第二起唱时间点从音频数据剪切一段第一音频片段,通过python依赖库提取所述第一音频片段的第二频率,将提取的所述第二频率转换为第二音高值序列,测量所述第二音高值序列的长度a、测量去除空值后的所述第二音高值序列的长度b,判断b/a是否大于0.65,若是,则将所述第一起唱时间点和第二起唱时间点中的较小值作为第三起唱时间点;若否,则将所述第一起唱时间点和第二起唱时间点中的较大值作为第三起唱时间点;
步骤S44、剔除所述音频数据中,所述第三起唱时间点之前的非歌唱段。
6.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S50具体包括:
步骤S51、通过python依赖库,根据所述音频数据的音频时域的静音处对音频数据进行切片并转换为频谱图片;
步骤S52、对各所述频谱图片进行二次谐波处理后,通过目标检测模型检测所述频谱图片中能量的突变位置和衰落位置,将所述突变位置作为音符的起始位置,将位于所述衰落位置后,取值为0的位置为音符的结束位置;
步骤S53、将所述起始位置和结束位置转换为对应的音符时间点;
步骤S54、通过python依赖库检测所述音频数据的频谱能量峰值时间点,基于所述频谱能量峰值时间点对音符时间点进行修正和补充。
7.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S60具体为:
基于各所述音符时间点对音频数据进行切片得到若干个第二音频片段,通过python依赖库提取所述第二音频片段的第三音高值序列,将各所述第三音高值序列中的众数作为音频数据的音频特征;
通过曲谱识别工具对所述曲谱数据进行扫描,识别所述曲谱数据中每个字对应的音高值和时间点,进而得到JSON格式的曲谱文件。
8.如权利要求1所述的一种基于片段式的多阶段自动音准评分方法,其特征在于:所述步骤S70具体为:
基于音频格式的采样率对所述音频特征进行音高值膨胀处理,再通过动态时间规整算法对所述音频特征和曲谱文件的音高值进行对齐处理,接着计算所述音频特征和曲谱文件的音高值的音高差值,基于所述音高差值对音频数据的音准进行自动评分,生成并展示评分结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310176329.2/1.html,转载请声明来源钻瓜专利网。