[发明专利]音频文件的生成方法、终端设备及介质在审
申请号: | 201811085971.5 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109326270A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 刘奡智;王义文;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G06N3/04;G06N3/08 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 神经网络模型 训练样本 音乐创作 终端设备 构建 人工智能技术 训练神经网络 目标音频 时间周期 依序排列 音乐作品 自动生成 创作 输出 检测 | ||
1.一种音频文件的生成方法,其特征在于,包括:
获取多个音频训练样本;
根据所述音频训练样本,构建并训练神经网络模型;
检测用户输入的用于构建目标音频波形的多个音名,并确定其中每一个所述音名对应的编码值;
通过所述神经网络模型对确定出的各个所述编码值进行处理,得到包含依序排列的多个键值对的第一键值对序列;每一个所述键值对包含键名及键值,所述键名表示音名所对应的编码值,所述键值表示音符时长;
生成基于所述第一键值对序列的音频文件。
2.如权利要求1所述的音频文件的生成方法,其特征在于,所述生成基于所述第一键值对序列的音频文件,包括:
对所述第一键值对序列中的各个所述键值对进行转换,输出与所述键值对匹配的各个所述音名;
判断各个所述音名是否满足预设的音频构建条件;
若各个所述音名均满足预设的音频构建条件,则生成基于各个所述键值对的音频文件;
若各个所述音名不满足预设的音频构建条件,则返回执行所述通过所述神经网络模型对确定出的各个所述编码值进行处理,得到包含依序排列的多个键值对的第一键值对序列的操作。
3.如权利要求2所述的音频文件的生成方法,其特征在于,所述判断各个所述音名是否满足预设的音频构建条件,包括:
在所述第一键值对序列的首部添加至少一个与休止信号匹配的键值对,得到第二键值对序列;
通过预设公式,计算所述第一键值对序列的自相关系数,所述预设公式包括:
根据所述自相关系数与预设阈值的大小关系,确定所述第一键值对序列所对应的各个所述音名是否满足预设的音频构建条件;
其中,所述r(Sequence1,Sequence2)表示所述自相关系数,所述Sequence1以及Sequence2分别表示所述第一键值对序列以及所述第二键值对序列;所述Cov()为协方差函数,Var()为方差函数。
4.如权利要求1所述的音频文件的生成方法,其特征在于,所述根据所述音频训练样本,构建并训练神经网络模型,包括:
构建多层神经网络模型,所述神经网络模型包括级联的循环神经网络以及强化学习网络;所述强化学习网络包括目标Q值网络、Q网络以及激励循环神经网络;
获取所述循环神经网络所包含的各项预设参数,并基于所述预设参数,对所述目标Q值网络以及所述Q网络进行初始化处理;
调整所述神经网络模型中的各项模型参数,直至检测到所述神经网络模型出现最优Q值。
5.如权利要求1所述的音频文件的生成方法,其特征在于,所述获取多个音频训练样本,包括:
获取已有音频信号中的多个采样音符;
根据所述采样音符的乐器数字接口MIDI音高,确定每一个所述采样音符所对应的所述编码值,并以预设时长为单位,记录其中每一个所述采样音符的音符时长;
基于各个所述采样音符及其对应的所述编码值以及所述音符时长,训练长短期记忆网络LSTM模型;
将实时采集的多路音频信号输入所述LSTM模型,获取所述LSTM模型输出的多个音频训练样本。
6.一种终端设备,包括存储器以及处理器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如下步骤:
获取多个音频训练样本;
根据所述音频训练样本,构建并训练神经网络模型;
检测用户输入的用于构建目标音频波形的多个音名,并确定其中每一个所述音名对应的编码值;
通过所述神经网络模型对确定出的各个所述编码值进行处理,得到包含依序排列的多个键值对的第一键值对序列;每一个所述键值对包含键名及键值,所述键名表示音名所对应的编码值,所述键值表示音符时长;
生成基于所述第一键值对序列的音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811085971.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空气动能音乐互动景观亭
- 下一篇:反作用力产生装置和电子键盘乐器