[发明专利]模型生成方法、音频处理方法、装置及计算机可读存储介质有效
申请号: | 201910238868.8 | 申请日: | 2019-03-27 |
公开(公告)号: | CN110136729B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 刘思阳 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;G10L19/04;G10L25/12;G10L25/24;G10L25/45;G06F16/683;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 方法 音频 处理 装置 计算机 可读 存储 介质 | ||
1.一种模型生成方法,其特征在于,所述方法包括:
针对各音频训练样本,根据所述音频训练样本得到对应的多个音频向量;
按照各音频向量在所述音频训练样本中的时序,将所述多个音频向量依次输入副歌音频处理模型,得到所述副歌音频处理模型输出的所述音频训练样本的预测副歌起止时间;
基于所述预测副歌起止时间以及所述音频训练样本的真实副歌起止时间,获取所述副歌音频处理模型的损失值;
在所述损失值在预设范围内的情况下,将所述副歌音频处理模型作为目标副歌音频处理模型;
所述根据所述音频训练样本得到对应的多个音频向量,包括:
将所述音频训练样本处理为第一预设时长的音频样本;
将所述音频样本按照第二预设时长分块,得到多个音频块;
对于每个所述音频块,将该音频块、与该音频块相邻的前m个音频块,以及与该音频块相邻的后n个音频块合成一个音频片段,得到该音频块对应的音频片段;所述m等于第一预设个数,所述n等于第二预设个数;
分别将每个所述音频片段转换为音频向量,得到多个音频向量;
所述将所述音频训练样本处理为第一预设时长的音频样本,包括:
若所述音频训练样本的时长大于所述第一预设时长,则将所述音频训练样本起始或结束位置进行截断,得到所述第一预设时长的音频样本。
2.根据权利要求1所述的方法,其特征在于,所述分别将每个所述音频片段转换为音频向量,包括:
利用梅尔频率倒谱系数算法分别将每个所述音频片段转换为音频向量。
3.根据权利要求1所述的方法,其特征在于,所述按照各音频向量在所述音频训练样本中的时序,将所述多个音频向量依次输入副歌音频处理模型之前,还包括:
对副歌音频处理模型中各层的参数进行初始化;其中,所述副歌音频处理模型包括音频向量编码层、全连接层以及归一化指数函数softmax层;
所述按照各音频向量在所述音频训练样本中的时序,将所述多个音频向量依次输入副歌音频处理模型,得到所述副歌音频处理模型输出的所述音频训练样本的预测副歌起止时间,包括:
按照各音频向量在所述音频训练样本中的时序,将所述多个音频向量依次输入所述音频向量编码层,得到目标编码向量;
将所述目标编码向量输入所述全连接层,得到所述音频训练样本的运算向量;
将所述运算向量输入所述softmax层,得到所述音频训练样本的预测副歌起止时间。
4.根据权利要求3所述的方法,其特征在于,所述音频向量编码层包括基于双向长短期记忆神经网络Bi-LSTM构建的:第一音频向量编码层、第二音频向量编码层和第三音频向量编码层;
所述将所述多个音频向量依次输入所述音频向量编码层,得到目标编码向量,包括:
将所述多个音频向量依次输入所述第一音频向量编码层,得到多个第一级编码向量;
将所述多个第一级编码向量输入所述第二音频向量编码层,得到多个第二级编码向量;
将所述多个第二级编码向量输入所述第三音频向量编码层,得到所述目标编码向量。
5.根据权利要求4所述的方法,其特征在于,所述将所述多个第一级编码向量输入所述第二音频向量编码层,得到多个第二级编码向量,包括:
将所述多个第一级编码向量按照时序划分为第一数量的第一合并向量,其中,所述第一合并向量的数量小于所述多个第一级编码向量的数量;
通过所述第二音频向量编码层基于所述第一数量的第一合并向量,输出所述第一数量的第二级编码向量。
6.根据权利要求5所述的方法,其特征在于,所述将所述多个第二级编码向量输入所述第三音频向量编码层,得到目标编码向量,包括:
将所述第一数量的第二级编码向量按照时序划分为第二数量的第二合并向量,其中,所述第二数量小于所述第一数量;
通过所述第三音频向量编码层基于所述第二数量的第二合并向量,输出所述第二数量的目标编码向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910238868.8/1.html,转载请声明来源钻瓜专利网。