[发明专利]一种音频事件识别模型的训练方法、装置及其设备有效

申请号：	202110847978.1	申请日：	2021-07-27
公开（公告）号：	CN113299314B	公开（公告）日：	2021-11-02
发明（设计）人：	龚亚光	申请（专利权）人：	北京世纪好未来教育科技有限公司
主分类号：	G10L25/30	分类号：	G10L25/30;G06N3/04
代理公司：	北京合智同创知识产权代理有限公司 11545	代理人：	李杰
地址：	100086 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频事件识别模型训练方法装置及其设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音频事件识别模型的训练方法，包括：

获取训练样本的集合，其中，所述训练样本的集合由包含真实弱标签的弱标签音频数据集合和包含真实强标签的强标签音频数据集合组成，所述真实弱标签用于表征弱标签音频数据中所包含的事件类型，所述真实强标签用于表征在强标签音频数据中的每一帧所包含的事件类型，所述弱标签音频数据包含所述真实弱标签，所述强标签音频数据包含所述真实强标签，所述弱标签音频数据集合包含至少一个所述弱标签音频数据，所述强标签音频数据集合包含至少一个所述强标签音频数据；

采用待训练模型确定所述训练样本的预测强标签；

根据训练样本的预测强标签确定所述训练样本的预测弱标签；

根据所述训练样本的预测强标签和真实强标签确定强标签损失值，以及，根据所述训练样本的预测弱标签和真实弱标签确定弱标签损失值；

根据所述强标签损失值和所述弱标签损失值的和确定训练损失值，根据所述训练损失值对所述待训练模型进行训练，生成目标模型。

2.如权利要求1所述的方法，其中，还包括：

获取无标签的音频数据；

采用所述目标模型预测生成所述无标签的音频数据的预测弱标签；

根据所述预测弱标签确定所述无标签的音频数据的伪标签，生成包含伪标签的伪标签音频数据集合；

将所述伪标签音频数据集合合并至所述弱标签音频数据集合中，生成新的弱标签音频数据集合。

3.如权利要求2所述的方法，其中，根据所述预测弱标签确定所述无标签的音频数据的伪标签，包括：

获取所述预测弱标签所对应的事件类型，其中，所述预测弱标签中通过概率值表征对应的事件类型的可能性；

若对应的事件类型的概率超过预设概率阈值，在所述预测弱标签中将所述对应的事件类型的概率值修订为表征事件类型存在的值；