[发明专利]音频分类方法和装置在审
申请号: | 201910117805.7 | 申请日: | 2019-02-15 |
公开(公告)号: | CN111583890A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 陈燕青;李腾;陈斯枫;黄杰;陆品冰;马辉;任佳亮;张启晟;张宏吉 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/18;G10L25/48 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 分类 方法 装置 | ||
1.一种音频分类方法,包括:
将待分类音频进行频谱化,以得到音频频谱图;
将音频频谱图送入机器学习(ML)图像分类器进行分类;
根据所述ML图像分类器的分类结果,确定所述待分类音频的所属分类。
2.如权利要求1所述的方法,还包括:
对频谱化的所述音频频谱图进行简化,以得到经简化的音频频谱图,并且,送入所述ML图像分类器进行分类的是所述经简化的音频频谱图。
3.如权利要求2所述的方法,其中,使用自编码器降低送入的所述音频频谱图的频谱维度,以得到经降维的音频频谱图作为所述经简化的音频频谱图。
4.如权利要求1所述的方法,其中,将待分类音频进行频谱化,以得到音频频谱图包括:
将待分类音频进行分帧和频谱变换,以得到音频分帧频谱图。
5.如权利要求4所述的方法,还包括:
将音频分帧频谱图进行组合,以得到经分帧组合的音频频谱图,并且,送入所述ML图像分类器进行分类的是所述经分帧组合的音频频谱图。
6.如权利要求1所述的方法,其中,待分类歌曲包括多个待分类音频,并且,
所述方法还包括:
根据包括的多个待分类音频的分类结果,确定所述待分类歌曲的所述分类。
7.如权利要求1所述的方法,其中,所述ML图像分类器是如下至少一项:
ANN分类器;
Softmax分类器;以及
SVM分类器。
8.如权利要求7所述的方法,其中,所述ML图像分类器是用于判定输入图片是否属于某一风格或听感的打标签器。
9.如权利要求8所述的方法,其中,将音频频谱图送入ML图像分类器进行分类包括:
将音频频谱图送入多个不同的打标签器进行标签判定,以及
根据所述ML图像分类器的分类结果,确定所述待分类音频的所属分类包括:
根据每个打标签器的判定结果,为所述待分类音频打上相应的标签。
10.如权利要求1所述的方法,还包括:
收集多个所述待分类音频的音频频谱图及其所属分类结果;以及
基于多个所述待分类音频的音频频谱图及其所属分类结果重训用于进行分类的所述ML图像分类器。
11.一种歌曲推荐方法,包括:
根据权利要求1-10中任一项所述的音频分类步骤,其中,所述待分类音频是待分类歌曲或其一部分;以及
至少基于用户播放历史中歌曲的所属分类,生成包含所属分类中其他歌曲的推荐歌单。
12.一种音频分类装置,包括:
音频图像化装置,用于将待分类音频进行频谱化,以得到音频频谱图;
图像分类装置,用于将音频频谱图送入机器学习(ML)图像分类器进行分类;
分类确定装置,用于根据所述ML图像分类器的分类结果,确定所述待分类音频的所属分类。
13.如权利要求12所述的装置,还包括:
图像简化装置,用于将所述音频频谱图送入用于降低送入的所述音频频谱图的频谱维度的自编码器,以得到经降维的音频频谱图,并且,所述图像分类装置送入所述ML图像分类器进行分类的是所述经降维的音频频谱图。
14.如权利要求12所述的装置,其中,所述音频图像化装置还用于:
将待分类音频进行分帧和频谱变换,以得到音频分帧频谱图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910117805.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信号传输方法与装置
- 下一篇:一种换热装置及热管理系统