[发明专利]应用于基础音乐视唱教育的视唱音频智能评分建模方法在审
申请号: | 201910480919.8 | 申请日: | 2019-06-04 |
公开(公告)号: | CN110265051A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 徐民洪;吴清强;刘昆宏;李昌春;黄仙寿;周道成;林辉杰 | 申请(专利权)人: | 福建小知大数信息科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/24;G10L25/30;G10L25/51;H04L12/58 |
代理公司: | 厦门龙格专利事务所(普通合伙) 35207 | 代理人: | 钟毅虹 |
地址: | 350001 福建省福州市鼓楼*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 建模 基础音乐 音频数据 抽取 预处理 短时傅里叶变换 梅尔倒谱系数 数据预处理 测试数据 方法提取 节拍信息 空白片段 频域特征 特征信息 信息使用 训练数据 音高信息 音频特征 节奏 智能 去噪 高音 剪裁 应用 教育 练习 音乐 帮助 | ||
1.一种应用于基础音乐视唱教育的视唱音频智能评分建模方法,其特征是:数据的获取和预处理包括以下步骤:
步骤一:将系统预先收集的包含专家评分的视唱练习数据进行划分,将数据按2:1划分,其中的2份作为训练数据,1份为测试数据,使用训练数据建模;
步骤二:将音频数据进行去噪,剪裁无音频的空白片段,进行人声增强的数据预处理;
步骤三:将音频数据使用梅尔倒谱系数方法提取音频特征,抽取音高信息;
步骤四:将音频数据使用短时傅里叶变换提取频域特征,抽取其中包含的节拍信息,形成基于节奏的特征;
步骤五:将标准音频按照步骤二到步骤四抽取音准和节奏特征;
步骤六:将标准音频和视唱练习音频采用基于动态时间调整算法,对基于梅尔倒谱系数法获得的音准特征,进行比对;
步骤七:将标准音频和视唱练习音频采用基于线性哈希缩放算法,对基于短时傅里叶方法获得的节奏特征进行比对;
步骤八:将获得的音高与节奏的匹配向量作为训练数据,利用训练神经网络,当在测试数据集误差率小于1%时,验证过程结束;
步骤九:利用微信小程序的客户端界面,上传用户个人练习时的视唱音频,对这些上传的音频进行步骤二至步骤四,以及步骤六、步骤七的处理,之后输入训练好的神经网络模型,由神经网络输出相应的节奏、音准评分;将神经网络输出的相应节奏、音准的评分结果输出给微信小程序的接口,在客户端显示分数;
步骤十:将相应的音准向量和节奏向量返回给用户客户端界面。
2.根据权利要求1所述的应用于基础音乐视唱教育的视唱音频智能评分建模方法,其特征是:基于步骤六,主要比对标准音频中的钢琴音高和视唱音频中的音高高低变化匹配程度;这里用到了线性音高校准的方法,先将人声和钢琴的音高进行线性缩放,确保其能量均值相同,在此基础上比较音频序列中音高变化的匹配向量。
3.根据权利要求1所述的应用于基础音乐视唱教育的视唱音频智能评分建模方法,其特征是:基于步骤七,主要比对标准音频中的钢琴节奏和视唱音频中的节奏快慢变化匹配程度,这里用到了线性节奏校准的方法,将人声的节奏进行线性缩放,确保其与钢琴的节奏变化率相同,在此基础上比较音频序列中节奏变化的匹配向量。
4.根据权利要求1所述的应用于基础音乐视唱教育的视唱音频智能评分建模方法,其特征是:基于步骤十,界面接口进行解析,标记在视唱曲目相应的曲谱位置,对用户匹配程度较差的位置进行标红注释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建小知大数信息科技有限公司,未经福建小知大数信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910480919.8/1.html,转载请声明来源钻瓜专利网。