[发明专利]一种适用于多场景、多类型的音频分类标签方法及系统在审
申请号: | 201711101625.7 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107943865A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 宫云梅 | 申请(专利权)人: | 阿基米德(上海)传媒有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 上海金盛协力知识产权代理有限公司31242 | 代理人: | 郑鸣捷 |
地址: | 200051 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 场景 类型 音频 分类 标签 方法 系统 | ||
1.一种适用于多场景、多类型的音频分类标签方法,该方法包括:
步骤1,制作短音频训练库,所述短音频训练库包括多个种类短音频库以便适应不同的场景,即每个短音频库对应一类短音频,每个短音频只属于其中一类,设置多个不同场景、不同类型的音频信号,是为确保信号的多样性,应用的广泛性;
步骤2,提取短音频库中音频信号的多个特征值作为训练模型的数据输入,采用多个不同的分类算法进行训练,得到多个不同的分类标签模型,进行横向、纵向等多角度分析比较音频的分类标签模型,针对不同项目得出最优分类标签模型;
步骤3,利用步骤2选出的最优分类标签模型,对待分类的短音频进行自动分类、打标签;若是只需要结果,不需要扩充音频库,这一步音频的分类、标签完成。
2.如权利要求1所述的音频分类标签方法,在步骤3之后还包括以下步骤:
步骤4,采用人工校对的方式对自动分类、打好标签的短音频进行校对,然后将校对好的短音频加入到短音频训练库对应类别的短音频库中;
步骤5,定期用扩充的新短音频训练库,重新训练、更新分类标签模型,即重复步骤2、步骤3,形成闭环系统,以保证随着音频库大量增加,分类标签模型更加趋于稳定,提高各种评估指标。
3.如权利要求1所述的音频分类标签方法,其中步骤2得到短音频多个分类标签模型后,还可以通过算法评估模块对所述多个分类标签模型的性能进行评估,从而确定相对于特定项目所需最优的短音频分类标签模型。
4.如权利要求1所述的音频分类标签方法,其中,骤1中短音频训练库可以通过人工对大量的音频节目进行试听、剪辑得到各类音频,然后,进行构建或扩充,剪辑得到每类短音频库,需要确保每个短音频只属于一个分类。
5.如权利要求1-4中任一项所述的音频分类标签方法,其中,步骤1中的多个不同场景、类型包括语音、纯音乐、广告、有歌声音乐、背景(音乐、噪声或者其它)语音以及其它场景/类型的短音频;步骤2中不同的音频信号特征值至少包括时域特征值、频域特征值、声学上的特征值、音频帧的特征值、音频段的特征值以及其它类型的音频信号特征值,或者几种特征值进行数学算法组合形成新的特征值;训练模型为机器学习分类算法模型包括:K最近邻模型(KNN)、混合高斯模型(GMM)、神经网络模型(CNN)、支持向量机模型(SVM)、隐马尔可夫模型(HMM)和决策树模型(Decision Trees),极端随机树(ETC),随机森林(RFC),梯度提升(GBC),极端梯度提升(XGBC),朴素贝叶斯(NBC)、逻辑回归(LR)及其它改进的分类算法模型。
6.如权利要求2所述的音频分类标签方法,其中步骤5中定期用扩充的新短音频训练库,重新训练、更新分类标签模型,具体包括:定期根据实际需要更新训练模型参数、采用更新后训练模型对待分类的短音频进行自动分类、打标签。
7.如权利要求2或6所述的音频分类标签方法,其中更新分类标签模型还包括对定期寻求新出现的分类算法集成到代码中。
8.一种适用于多场景、多类型的音频分类标签系统,该系统包括:
短音频训练库构建模块,用于为用户提供接口制作短音频训练库,所述短音频训练库包括多个短音频库,每个短音频库对应一类短音频,每个短音频只属于其中一类;
分类标签模型构建模块,用于提取短音频训练库中不同类型的音频信号特征值作为训练模型的数据输入,采用多个不同的分类算法进行训练,得到多个不同的分类标签模型;
算法评估模块,用于对所述多个分类标签模型的性能进行评估,采用横向、纵向等多角度分析比较音频的分类标签结果,针对不同项目选择最优算法模型;
短音频分类标签处理模块,利用分类标签模型构建模块得到的最优分类标签模型对待分类的短音频进行自动分类、打标签;
分类校对确认模块,为用户提供相应的接口以便采用人工校对的方式对自动分类、打好标签的短音频进行校对;
短音频训练库更新模块,用于将校对好的短音频加入到短音频训练库中对应类别的短音频库中;
分类标签模型更新模块,用于定期重新训练所述短音频训练库、更新分类标签模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿基米德(上海)传媒有限公司,未经阿基米德(上海)传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711101625.7/1.html,转载请声明来源钻瓜专利网。