[发明专利]基于深度学习的和弦进行生成方法在审
申请号: | 201910527315.4 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110264987A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 王子豪;魏东来;王文玉;赵梓良 | 申请(专利权)人: | 王子豪 |
主分类号: | G10H1/38 | 分类号: | G10H1/38;G06K9/00;G06K9/34;G06K9/62;G06F17/27;G06F17/28;G06N3/04;G06N3/08 |
代理公司: | 南京利丰知识产权代理事务所(特殊普通合伙) 32256 | 代理人: | 王锋 |
地址: | 257400 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 和弦 旋律 机器翻译 注意力机制 数据集 自动翻译 计算机视觉技术 和弦数据 模型训练 序列输入 旋律数据 音乐旋律 翻译 乐理 准确率 学习 检测 制作 配合 | ||
1.一种基于深度学习的和弦进行生成方法,其特征在于,所述方法包括:
S1、基于计算机视觉技术制作数据集,数据集包括旋律数据及和弦数据;
S2、通过数据集训练基于注意力机制的旋律-和弦机器翻译模型;
S3、检测旋律序列,并将旋律序列输入至基于注意力机制的旋律-和弦机器翻译模型,获取对应的和弦序列。
2.根据权利要求1所述的基于深度学习的和弦进行生成方法,其特征在于,所述步骤S1具体为:
S11、获取若干乐谱图片;
S12、对乐谱图片进行分割处理,得到旋律区域图片及对应的和弦区域图片;
S13、将旋律区域图片及和弦区域图片对应转化为旋律文本数据及和弦文本数据,旋律文本数据包括高音和时值参数,和弦文本数据包括字母;
S14、对旋律文本数据及和弦文本数据进行处理得到数据集。
3.根据权利要求2所述的基于深度学习的和弦进行生成方法,其特征在于,所述步骤S12具体为:
对乐谱图片进行一次高斯滤波降噪,再将乐谱图片进行横向投影,得到像素堆积的峰值特征;
追踪峰值特征定位到每行线谱的位置,裁剪出上方的旋律序列和下方的和弦序列;
将线谱、旋律序列、和弦序列标记合在一起的一行乐谱图片做纵向投影,追踪小节线特征将乐谱图片切割为旋律区域图片及和弦区域图片。
4.根据权利要求2所述的基于深度学习的和弦进行生成方法,其特征在于,所述步骤S14具体为:
对旋律文本数据及和弦文本数据进行降维处理,去除旋律文本数据中的时值参数。
5.根据权利要求1所述的基于深度学习的和弦进行生成方法,其特征在于,所述旋律-和弦机器翻译模型为旋律序列到和弦序列的机器翻译模型,包括编码器和解码器,所述编码器和解码器均使用LSTM长短期记忆循环神经网络,编码器用于接收旋律序列并加工成中间语义向量C,所述解码器用于将中间语义向量C转换为对应的和弦序列。
6.根据权利要求5所述的基于深度学习的和弦进行生成方法,其特征在于,所述基于注意力机制的旋律-和弦机器翻译模型中,编码器用于接收旋律序列并加工成中间语义向量Ci,解码器用于将中间语义向量Ci转换为对应的和弦序列,中间语义向量Ci为:
其中,Lx是旋律序列的长度,aij是输出第i个和弦序列时对旋律序列第j段局部旋律的注意力系数,hj是旋律序列第j段局部旋律的语义编码。
7.根据权利要求6所述的基于深度学习的和弦进行生成方法,其特征在于,所述中间语义向量Ci中,aij的计算方法为:
使用输出和弦序列i-1时刻的隐藏状态Hi-1去逐个与输入旋律序列中每个局部旋律对应的神经网络隐藏状态hj进行比对,通过匹配函数F(hj,Hi-1)来获得当前输入的和弦序列所产生的解码器隐藏状态与之前编码器逐个依次输入局部旋律记录得到的多个编码器隐藏状态进行比较;
通过匹配函数F(hj,Hi-1)得到多个数值,并统一输出到SoftMax函数中进行归一化后得到符合概率分布区间取值的注意力分配概率分布数值。
8.根据权利要求7所述的基于深度学习的和弦进行生成方法,其特征在于,所述匹配函数F(hj,Hi-1)为加权求和函数。
9.根据权利要求1所述的基于深度学习的和弦进行生成方法,其特征在于,所述步骤S3中的“检测旋律序列”包括:
S31、确定拍速BPM;
S32、调整麦克风灵敏度阈值;
S33、使用麦克风检测旋律,得到旋律序列。
10.根据权利要求9所述的基于深度学习的和弦进行生成方法,其特征在于,所述步骤S33具体为:
按照固定频率BPM/60*4次/秒,调用detect函数来获取当前外界的频率值存入到数组中;
旋律的存储结构采用JAVA内部类,类内包括音高和时值两个成员变量。停止后,数组内音高前后相同的进行合并,转储为旋律序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王子豪,未经王子豪许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910527315.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在线K歌装置、方法及计算机可读存储介质
- 下一篇:一种薄膜穿孔板复合材料