[发明专利]音频分类方法及装置、计算机设备及存储介质有效
申请号: | 201711107617.3 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107885845B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 劳振锋;刘翠 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/68 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 分类 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种音频分类方法及装置、计算机设备及存储介质,属于计算机技术领域。所述方法包括:获取待分类音频所属的目标词条,所述目标词条中包括音频属性相同的音频,所述音频属性用于表征音频的特征;判断所述目标词条是否为纯音乐词条;当所述目标词条为纯音乐词条时,确定所述待分类音频为纯音乐。本发明解决了相关技术中对音频分类的可靠性较低的问题。本发明用于音频分类。
技术领域
本发明涉及计算机技术领域,特别涉及一种音频分类方法及装置、计算机设备及存储介质。
背景技术
随着互联网及移动通信技术的快速发展,听音乐已经成为人们生活中一种重要的娱乐方式,因此,音乐播放软件需要配置有资源丰富的曲库,从而为用户提供服务。为了满足用户的个性化需求,通常需要对曲库中的音乐进行分类,例如,对曲库中的音乐进行分类后得到的类别可以包括纯音乐类别。
相关技术中,可以通过自动识别算法(例如机器学习算法)对音频中的人声进行识别,将曲库中有人声的音频归类为有人声音乐类别,将曲库中无人声的音频归类为纯音乐类别。
但是,相关技术中分类得到的纯音乐类别中包括的音频只能是无人声的,而无人声的音频还包括伴奏音频,由于纯音乐是一种不包含填词的音频,而伴奏音频是一种填词音乐中除词以外的音频部分,即伴奏音频是一种有人声音乐中除人声以外的音频部分,因此,伴奏音频不能算是纯音乐,相关技术中对音频分类的可靠性较低。
发明内容
本发明实施例提供了一种音频分类方法及装置、计算机设备及存储介质,可以解决相关技术中对音频分类的可靠性较低的问题。所述技术方案如下:
第一方面,提供了一种音频分类方法,所述方法包括:
获取待分类音频所属的目标词条,所述目标词条中包括音频属性相同的音频,所述音频属性用于表征音频的特征;
判断所述目标词条是否为纯音乐词条;
当所述目标词条为纯音乐词条时,确定所述待分类音频为纯音乐。
可选的,所述目标词条中的每个音频均具有一个分类信息和一个类别标签,所述分类信息用于表征音频的粗粒度类型,所述类别标签用于表征音频的细粒度类型,所述分类信息包括可疑人声类或可疑纯音乐类,所述类别标签包括伴奏标签;
所述判断所述目标词条是否为纯音乐词条,包括:
当所述目标词条中所有音频的分类信息均不为可疑人声类,且所述目标词条中所有音频的类别标签均不为伴奏标签时,判断第一比值是否大于预设比值阈值,所述第一比值为所述所有音频中分类信息为可疑纯音乐类的音频的数量与所述所有音频的数量的比值;
当所述第一比值大于所述预设比值阈值时,确定所述目标词条为纯音乐词条。
可选的,所述类别标签还包括铃声标签,所述方法还包括:
当所述第一比值不大于所述预设比值阈值时,检测所述目标词条中除类别标签为铃声标签的音频以外的音频的分类信息是否均为可疑纯音乐类;
当所述目标词条中除类别标签为铃声标签的音频以外的音频的分类信息均为所述可疑纯音乐类时,确定所述目标词条为纯音乐词条。
可选的,所述类别标签还包括伴奏标签,在所述检测第一比值是否大于预设比值阈值之前,所述方法还包括:
检测所述目标词条中每个音频的类别标签是否为伴奏标签;
当所述目标词条中任一音频的类别标签为伴奏标签时,确定所述目标词条为非纯音乐词条。
可选的,所述方法还包括:
确定所述目标词条中每个音频的分类信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711107617.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车转向机包壳结构
- 下一篇:一种滚珠滑动转向轴传动副