[发明专利]模型训练方法、音乐生成方法、装置和电子设备有效
申请号: | 201910394927.0 | 申请日: | 2019-05-13 |
公开(公告)号: | CN110264984B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 刘思阳 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/30;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 音乐 生成 装置 电子设备 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
对音乐片段文件进行预处理,确定音乐片段中各时刻对应的音符矩阵、音符上下文矩阵和音符位置矩阵;
对于所述音乐片段的每个时刻,将该时刻对应的音符矩阵和音符位置矩阵进行拼接,生成第一拼接矩阵;将该时刻对应的音符上下文矩阵和音符位置矩阵进行拼接,生成第二拼接矩阵;将所述第一拼接矩阵输入至第一循环神经网络,将所述第二拼接矩阵输入至第二循环神经网络;将所述第一循环神经网络输出的第一输出矩阵与所述第二循环神经网络输出的第二输出矩阵进行拼接,生成第三拼接矩阵;将所述第三拼接矩阵输入至第三循环神经网络,得到所述第三循环神经网络输出的预测矩阵;
基于所述各时刻对应的音符矩阵和所述第三循环神经网络所依次输出的预测矩阵,利用机器学习方法对所述各循环神经网络进行训练,生成包含训练后的各循环神经网络的音乐生成模型;
其中,对音乐片段文件进行预处理,确定音乐片段中各时刻对应的音符矩阵、音符上下文矩阵和音符位置矩阵,包括:
将音乐片段中各时刻的音符信息转换为音符矩阵,并汇总为音符矩阵时序序列;
对于所述音符矩阵时序序列中的每一个音符矩阵,将包含该音符矩阵的连续多个音符矩阵作为音符矩阵子序列,对所述音符矩阵子序列进行卷积操作,生成该音符矩阵对应的音符上下文矩阵;
对于所述音符矩阵时序序列中的每一个音符矩阵,确定该音符矩阵在所属小节中的位置,生成用于指示所述位置的音符位置矩阵。
2.根据权利要求1所述的模型训练方法,其特征在于,所述音乐片段文件记录有音乐片段中各时刻的音符信息,所述音乐片段包括第一预设数量的小节,每一小节包括第二预设数量的节拍,每个节拍对应有第三预设数量的音符信息。
3.根据权利要求2所述的模型训练方法,其特征在于,所述对于所述音符矩阵时序序列中的每一个音符矩阵,确定该音符矩阵在所属小节中的位置,生成用于指示所述位置的音符位置矩阵,包括:
对于所述音符矩阵时序序列中的每一个音符矩阵,确定该音符矩阵在所属小节中的位置,生成用于指示所述位置的音符位置向量,其中,所述音符位置向量为独热编码向量;
将所述音符位置向量作为目标矩阵的行,生成目标行数的目标矩阵,将所述目标矩阵的转置矩阵作为该音符矩阵对应的音符位置矩阵,其中,所述目标行数与该音符矩阵的列数相同。
4.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述各时刻对应的音符矩阵和所述第三循环神经网络所依次输出的预测矩阵,利用机器学习方法对所述各循环神经网络进行训练,生成包含训练后的各循环神经网络的音乐生成模型,包括:
对于所述音乐片段中的每一个时刻,将该时刻对应的音符矩阵和预测矩阵输入至预先建立的损失函数,得到损失值;
将各时刻对应的损失值进行相加,得到目标损失值;
基于所述目标损失值,对所述各循环神经网络进行训练,生成包含训练后的各循环神经网络的音乐生成模型。
5.根据权利要求1-4之一所述的模型训练方法,其特征在于,所述各循环神经网络为长短期记忆LSTM网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910394927.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢琴演奏智能乐谱架及使用方法
- 下一篇:一种动态声学处理系统及方法