[发明专利]一种适用于多场景、多类型的音频分类标签方法及系统在审
申请号: | 201711101625.7 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107943865A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 宫云梅 | 申请(专利权)人: | 阿基米德(上海)传媒有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 上海金盛协力知识产权代理有限公司31242 | 代理人: | 郑鸣捷 |
地址: | 200051 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适合多场景、多类型的音频分类标签方法及系统。本发明提供的系统和方法能适用于多场合、多类型的音频分类、标签,通过对服务器上大量的广播音频节目进行自动分类、打标签、人工校对得到大量分类、打标签的短音频库,组成丰富的音频训练库,通过增加多样化的特征提取,使得对各种分类标签模型的训练更加准确,稳定,便于全面对比各种分类标签模型的性能。 | ||
搜索关键词: | 一种 适用于 场景 类型 音频 分类 标签 方法 系统 | ||
【主权项】:
一种适用于多场景、多类型的音频分类标签方法,该方法包括:步骤1,制作短音频训练库,所述短音频训练库包括多个种类短音频库以便适应不同的场景,即每个短音频库对应一类短音频,每个短音频只属于其中一类,设置多个不同场景、不同类型的音频信号,是为确保信号的多样性,应用的广泛性;步骤2,提取短音频库中音频信号的多个特征值作为训练模型的数据输入,采用多个不同的分类算法进行训练,得到多个不同的分类标签模型,进行横向、纵向等多角度分析比较音频的分类标签模型,针对不同项目得出最优分类标签模型;步骤3,利用步骤2选出的最优分类标签模型,对待分类的短音频进行自动分类、打标签;若是只需要结果,不需要扩充音频库,这一步音频的分类、标签完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿基米德(上海)传媒有限公司,未经阿基米德(上海)传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711101625.7/,转载请声明来源钻瓜专利网。