[发明专利]模型生成方法、音频处理方法、装置及计算机可读存储介质有效
申请号: | 201910238868.8 | 申请日: | 2019-03-27 |
公开(公告)号: | CN110136729B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 刘思阳 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;G10L19/04;G10L25/12;G10L25/24;G10L25/45;G06F16/683;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了模型生成方法、音频处理方法、装置及计算机可读存储介质,属于计算机技术领域。该生成方法可以针对各音频训练样本,根据该音频训练样本得到对应的多个音频向量,按照多个音频向量对应在音频训练样本中的时序,将多个音频向量依次输入副歌音频处理模型,基于该音频训练样本的预测副歌起止时间以及该音频训练样本的真实副歌起止时间,获取副歌音频处理模型的损失值,在损失值在预设范围内的情况下,说明副歌音频处理模型可以输出较准确的副歌起止时间,则利用该目标副歌音频处理模型在对待处理音频处理时,能够基于训练学习中的各参数,自动得到准确的副歌起止时间。 | ||
搜索关键词: | 模型 生成 方法 音频 处理 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种模型生成方法,其特征在于,所述方法包括:针对各音频训练样本,根据所述音频训练样本得到对应的多个音频向量;按照各音频向量在所述音频训练样本中的时序,将所述多个音频向量依次输入副歌音频处理模型,得到所述副歌音频处理模型输出的所述音频训练样本的预测副歌起止时间;基于所述预测副歌起止时间以及所述音频训练样本的真实副歌起止时间,获取所述副歌音频处理模型的损失值;在所述损失值在预设范围内的情况下,将所述副歌音频处理模型作为目标副歌音频处理模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910238868.8/,转载请声明来源钻瓜专利网。