[发明专利]一种基于LSTM的音乐自动合成方法及系统在审
申请号: | 201910346123.3 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110164412A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 刘立勋;赵一帆 | 申请(专利权)人: | 吉林大学珠海学院 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10H1/00;G10H7/00;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 陈慧华 |
地址: | 519041 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 文本数据 音乐数据 自动合成 歌词 解码 分词处理 神经网络 时间节点 时间索引 时间循环 预测处理 整体设计 重新编码 输出 优化器 最小化 乐谱 音乐 创建 解析 音符 网络 歌曲 学习 概率 预测 艺术 分析 发现 | ||
1.一种基于LSTM的音乐自动合成方法,其特征在于,该方法包括:
S10,准备多种不同类型的MIDI音乐数据,解析音乐数据获取对应的乐谱及时间节点,并将读取结果创建对应的第一向量;
S20,将对应歌曲的歌词进行分词处理,并以歌词为基准创建对应具有相关性的第二向量;
S30,使用时间循环神经网络将第一向量作为输入,第二向量作为输出,使用优化器学习预测处理;
S40,在时间索引的每个预测中输出每个状态的概率;
S50,将生成的结果重新编码为MIDI文件。
2.根据权利要求1所述的基于LSTM的音乐自动合成方法,其特征在于,所述步骤S10具体包括:
从多种类型流行曲的MIDI中提解析相关的乐谱及时间节点,并用使用onehot编码将对应的127个不同的音符编码成一个长度为127维的onehot向量。
3.根据权利要求1所述的基于LSTM的音乐自动合成方法,其特征在于,所述步骤S20具体包括:
基于现有的分词库将歌词分词,并使用DF-IF算法将各个词汇编码成对应唯一的有相关性的向量。
4.根据权利要求1所述的基于LSTM的音乐自动合成方法,其特征在于,所述步骤S30具体包括:
使用第一LSTM层及第二LSTM层将音符编码进行作为输入,词汇编码进行输出,使用优化器进行预测学习。
5.根据权利要求4所述的基于LSTM的音乐自动合成方法,其特征在于,所述第一LSTM层及第二LSTM层后添加带有滑动模块的Attention机制层,并且使用分类交叉熵作为损失函数,第一LSTM层及第二LSTM层包括512个隐藏单元。
6.根据权利要求4所述的基于LSTM的音乐自动合成方法,其特征在于,所述优化器为ADAM优化器。
7.根据权利要求1所述的基于LSTM的音乐自动合成方法,其特征在于,所述步骤S40具体包括:
S41,在预测阶段添加多样性参数α,所述α用于通过加权概率抑制或鼓励预测多样性,其中α的第i个状态pi的概率被重新加权为
S42,根据重新加权概率对状态进行采样来选择状态之一,其中第一LSTM层及第二LSTM层始终保持相同层数。
8.一种用于执行权利要求1-7任意所述方法的基于LSTM的音乐自动合成系统,其特征在于,该系统包括:
准备模块,用于准备多种不同类型的音乐数据,解析音乐数据获取对应的乐谱及时间节点,以及,将MIDI音符创建对应的第一向量;
分词模块,用于将对应歌曲的歌词进行分词处理,并以歌词为基准创建对应具有相关性的第二向量;
训练模块,用于使用时间循环神经网络将第一向量作为输入,以及,将第二向量作为输出,使用优化器学习预测处理;
预测模块,用于在时间索引的每个预测中输出每个状态的概率;
输出模块,用于将生成的结果重新编码为MIDI文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学珠海学院,未经吉林大学珠海学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910346123.3/1.html,转载请声明来源钻瓜专利网。