[发明专利]基于神经网络的音乐生成方法及装置在审
申请号: | 201811338694.4 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109448683A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 王义文;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10H7/00 | 分类号: | G10H7/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐序列 音符 网络模型 网络层 上下文信息 持续时长 合成音乐 神经网络 音乐生成 目标音乐数据 获取目标 聚类处理 音乐合成 音乐数据 全局 输出 | ||
1.一种基于神经网络的音乐生成方法,其特征在于,包括:
获取目标音乐数据,对所述目标音乐数据进行聚类处理得到全局音乐序列;
获取第一音乐序列,将所述全局音乐序列与所述第一音乐序列输入长短时记忆LSTM网络模型,基于所述LSTM网络模型的第一网络层确认所述第一音乐序列对应的序列上下文信息并输出所述序列上下文信息对应的目标音符;
将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层获得所述目标音符的输入持续时长信息;
根据所述目标音符的输入持续时长信息与所述目标音符,生成第二音乐序列,基于所述第二音乐序列得到合成音乐。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标音乐数据进行聚类处理得到全局音乐序列,包括:
获取所述目标音乐数据中的多个连续音符,并计算所述多个连续音符对应的音符直方图;
基于聚类分析对所述音符直方图进行分类,得到目标聚类集合,所述目标聚类集合包括至少两个聚类,且各个聚类均由至少一个音符直方图组成;
选择所述目标聚类集合中的任一聚类,根据所述任一聚类得到全局音乐序列。
3.根据权利要求1所述的方法,其特征在于,所述第一音乐序列中包括至少7个连续的音符;所述第一网络层包括Key Layer,所述Key Layer由第一循环神经网络RNN构成;
所述基于所述LSTM网络模型的第一网络层确认所述第一音乐序列对应的序列上下文信息并输出所述序列上下文信息对应的目标音符,包括:
获取所述全局音乐序列与所述第一音乐序列对应的音符表示信息,基于所述第一RNN中的LSTM单元根据所述全局音乐序列与所述第一音乐序列,以及所述音符表示信息确定所述第一音乐序列对应的序列上下文信息;
根据所述序列上下文信息确定所述第一音乐序列的最后一个音符的下一个音符,输出所述下一个音符以得到所述序列上下文信息对应的目标音符。
4.根据权利要求1或3所述的方法,其特征在于,所述第二音乐序列中包括旋律,所述第二网络层包括Press Layer,所述Press Layer由第二RNN构成;
所述将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层获得所述目标音符的输入持续时长信息,包括:
将所述目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层中的所述第二RNN,获得所述目标音符的输入持续时长信息;
其中,所述目标音符的输入持续时长信息用于与所述目标音符生成旋律。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
判断所述旋律中相邻音符之间是否具有连续性;
若所述旋律中相邻音符之间不具有连续性,则对所述旋律中的音符进行音符位置调整或对所述旋律中的音符进行删除,以对所述旋律进行连续性优化。
6.根据权利要求4所述的方法,其特征在于,所述第二音乐序列中还包括和弦,所述第二网络层还包括Chord Layer,所述Chord Layer由第三RNN构成;所述方法还包括:
获取所述第一网络层输出的多个连续的目标音符;
将所述多个连续的目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层中的所述第三RNN生成所述多个连续的目标音符对应的和弦;
其中,所述和弦用于结合所述旋律得到合成音乐。
7.根据权利要求4或6所述的方法,其特征在于,所述第二音乐序列中还包括节拍,所述第二网络层还包括Drum Layer,所述Drum Layer由第四RNN构成;所述方法还包括:
获取所述第一网络层输出的多个连续的目标音符;
将所述多个连续的目标音符输入所述LSTM网络模型的第二网络层,通过所述第二网络层中的所述第四RNN生成所述多个连续的目标音符对应的节拍;
其中,所述节拍用于结合所述旋律和/或所述和弦得到合成音乐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811338694.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实现话筒与点唱机互动的系统及其使用方法
- 下一篇:一种复合吸声降噪装置