[发明专利]模型训练方法、装置、设备及存储介质在审
申请号: | 202011478539.X | 申请日: | 2020-12-15 |
公开(公告)号: | CN112489676A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 王征韬 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 陈彦如 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 设备 存储 介质 | ||
本申请公开了一种模型训练方法、装置、设备及存储介质,在该方案中,先利用基于有标签鼓点音频集训练得到的目标模型处理无标签样本集,然后根据得到无标签样本集中的各个样本对应的类别结果,从无标签样本集中选择类别结果的置信度较小的待标注样本打标签,并将具有标签的待标注样本添加至有标签鼓点音频集,从而获得新的训练集,最后利用新的训练集训练目标模型,从而得到鼓点识别模型。样本的类别结果的置信度越小,说明模型对该样本的识别能力越低,所以将具有标签的此类样本添加至训练集,可以让模型学习到识别此类样本的能力,故模型的识别能力和性能可得到提升。本申请提供的模型训练装置、设备及存储介质,也同样具有上述技术效果。
技术领域
本申请涉及机器学习技术领域,特别涉及一种模型训练方法、装置、设备及存储介质。
背景技术
识别音频中的鼓点类型可以为音乐游戏和视频剪辑工具的制作提供基础数据。目前,一般对无干扰的鼓点录音音频进行机器学习,从而训练获得鼓点识别模型,然后利用该鼓点识别模型识别音频作品(如:有声电影、电视、录像、唱片等)中的鼓点类型。但由于该鼓点识别模型基于无干扰的鼓点录音音频训练获得,因此其识别有干扰的音频作品的能力不足。
因此,如何获得适用于识别有干扰的音频作品的鼓点识别模型,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种模型训练方法、装置、设备及存储介质,以获得适用于识别有干扰的音频作品的鼓点识别模型。其具体方案如下:
为实现上述目的,一方面,本申请提供了一种模型训练方法,包括:
利用目标模型处理无标签样本集,以得到所述无标签样本集中的各个样本对应的类别结果;所述目标模型利用有标签鼓点音频集训练得到,所述无标签样本集中的各个样本为从音频作品中截取的鼓点音频;
确定所述各个样本对应的类别结果的置信度,并将置信度小于置信度阈值的样本添加至候选集;
在所述候选集中选择待标注样本,对所述待标注样本打标签后,将具有标签的所述待标注样本添加至所述有标签鼓点音频集,以得到训练集;
利用所述训练集训练所述目标模型,以得到鼓点识别模型。
又一方面,本申请还提供了一种模型训练装置,包括:
分类模块,用于利用目标模型处理无标签样本集,以得到所述无标签样本集中的各个样本对应的类别结果;所述目标模型利用有标签鼓点音频集训练得到,所述无标签样本集中的各个样本为从音频作品中截取的鼓点音频;
选择模块,用于确定所述各个样本对应的类别结果的置信度,并将置信度小于置信度阈值的样本添加至候选集;
更新模块,用于在所述候选集中选择待标注样本,对所述待标注样本打标签后,将具有标签的所述待标注样本添加至所述有标签鼓点音频集,以得到训练集;
训练模块,用于利用所述训练集训练所述目标模型,以得到鼓点识别模型。
又一方面,本申请还提供了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述模型训练方法。
又一方面,本申请还提供了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述模型训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011478539.X/2.html,转载请声明来源钻瓜专利网。