[发明专利]模型训练方法、装置、设备及存储介质在审

申请号：	202011478539.X	申请日：	2020-12-15
公开（公告）号：	CN112489676A	公开（公告）日：	2021-03-12
发明（设计）人：	王征韬	申请（专利权）人：	腾讯音乐娱乐科技（深圳）有限公司
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/27;G06K9/62
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	陈彦如
地址：	518052 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种模型训练方法，其特征在于，包括：

利用目标模型处理无标签样本集，以得到所述无标签样本集中的各个样本对应的类别结果；所述目标模型利用有标签鼓点音频集训练得到，所述无标签样本集中的各个样本为从音频作品中截取的鼓点音频；

确定所述各个样本对应的类别结果的置信度，并将置信度小于置信度阈值的样本添加至候选集；

在所述候选集中选择待标注样本，对所述待标注样本打标签后，将具有标签的所述待标注样本添加至所述有标签鼓点音频集，以得到训练集；

利用所述训练集训练所述目标模型，以得到鼓点识别模型。

2.根据权利要求1所述的模型训练方法，其特征在于，所述确定所述各个样本对应的类别结果的置信度，包括：

确定所述各个样本对应的类别结果的迷惑度和/或信息熵，并根据所述迷惑度和/或所述信息熵确定所述置信度。

3.根据权利要求1所述的模型训练方法，其特征在于，所述在所述候选集中选择待标注样本，包括：

若所述候选集中的样本个数大于数量阈值，则将所述候选集中的所有样本按照置信度大小升序排列，以得到样本序列；

获取当前迭代次数，并在所述样本序列中查询与所述当前迭代次数相等的排列位置；

将处于所述排列位置上的样本作为对比样本，并计算所述对比样本与排列在所述对比样本后的其他样本之间的相似度；

基于所述相似度得到更新集，将所述更新集中的所有样本确定为所述待标注样本。

4.根据权利要求3所述的模型训练方法，其特征在于，所述基于所述相似度得到更新集，包括：

从所述候选集中删除大于相似度阈值的相似度对应的其他样本，以得到所述更新集。

5.根据权利要求4所述的模型训练方法，其特征在于，还包括：

判断删除后的所述候选集中的样本个数是否大于所述数量阈值；

若是，则将迭代次数增一，并执行将所述候选集中的所有样本按照置信度大小升序排列，以得到样本序列；获取当前迭代次数，并在所述样本序列中查询与所述当前迭代次数相等的排列位置；将处于所述排列位置上的样本作为对比样本，并计算所述对比样本与排列在所述对比样本后的其他样本之间的相似度，从所述候选集中删除大于相似度阈值的相似度对应的其他样本，并执行判断删除后的所述候选集中的样本个数是否大于所述数量阈值；

若删除后的所述候选集中的样本个数不大于所述数量阈值，则得到所述更新集。

6.根据权利要求1所述的模型训练方法，其特征在于，所述在所述候选集中选择待标注样本，包括：

将所述候选集中的所有样本按照置信度大小降序排列，以得到第一样本序列；

选择所述第一样本序列中的后N个样本作为所述待标注样本，N等于数量阈值；

或

将所述候选集中的所有样本按照置信度大小升序排列，以得到第二样本序列；

选择所述第二样本序列中的前N个样本作为所述待标注样本，N等于数量阈值。

7.根据权利要求1至6任一项所述的模型训练方法，其特征在于，还包括：

若不存在置信度小于置信度阈值的样本，则按照所述各个样本对应的类别结果对所述无标签样本集中的各个样本打标签，以将所述无标签样本集转换为有标签样本集；

将所述有标签样本集与所述有标签鼓点音频集合并，并利用合并得到的数据集训练所述目标模型，以得到鼓点识别模型。

8.根据权利要求1所述的模型训练方法，其特征在于，所述得到鼓点识别模型之后，还包括：

从所述无标签样本集中删除所述待标注样本后，将所述鼓点识别模型作为所述目标模型，并执行所述利用目标模型处理无标签样本集，以得到所述无标签样本集中的各个样本对应的类别结果的步骤。