[发明专利]基于谱聚类的音频数据聚类方法有效
申请号: | 201610899028.2 | 申请日: | 2016-10-14 |
公开(公告)号: | CN106649513B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 徐森;徐秀芳;花小朋;徐静;徐宁;皋军;安晶;曹瑞 | 申请(专利权)人: | 盐城工学院 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06K9/62 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 范晴;丁浩秋 |
地址: | 224051 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 谱聚类 音频 数据 方法 | ||
本发明公开了一种基于谱聚类的音频数据聚类方法,包括以下步骤:计算音频数据的音频周期,按照音频周期进行分帧处理,提取音频特征;以帧频谱图峰值最大处的频率序列方差为横轴、以每帧功率和的序列方差的对数值为纵轴、以功率和的平均值为Z轴,构建音频三维坐标系,得到三维音频向量,然后根据音频向量间的距离计算相似度,得到音频数据的相似度矩阵S;利用谱聚类方法对音频数据进行聚类。本发明可为海量的音乐自动分类提供实用方法,并且能精准的推荐给不同的用户增强用户体验。
技术领域
本发明涉及一种音频数据聚类方法,具体地涉及一种基于谱聚类的音频数据聚类方法。
背景技术
近二十年,因互联网惊人的发展速度,海量信息不断涌现。如何从海量信息中找到有用的信息,已经成为各大网络数据公司面临的主要问题。传统的统计和计算已经不能满足于公众和各大公司的需求,源自数据挖掘、机器学习等领域的方法迅速发展。通过设置一定的规则和条件,能够快速有效地找出海量数据中的有用信息。
网易云音乐已经收录了3500万的不同歌曲和音乐,同时,在美国,每周会有大约50张专辑发布,平均每张专辑会有12首左右的音乐。如何快速对这些数量众多的音乐和歌曲进行分类成为了难题。而且音乐的分类方法又各有各的不同,可以按照音乐的情感分类,也可以按照演奏方式分类,有时,摇滚音乐下面就可以被细分为上百种类型,电子音乐甚至可以被细分为超过500种类型。而早期的音乐分类方式往往是唱片公司人为的添加类型标签供买家选择,而有时又是由专门收录音乐的网站添加标签,不同的人对同一首音乐的感受往往各不相同,因此也极有可能添加了不同的标签。因此,由计算机对音频数据识别后进行分类得到的结果更方便我们对音乐不同类型的区别进行研究,也可以方便我们直接将同类型的音乐推荐给用户。
聚类分析将数据元素在无监督的环境下进行自动划分并从中找出隐含规律的科学研究方法。聚类过程即根据不同的特征以及不同的统计量将数据分别划分到不同的簇的过程。通常情况下,在每个独立的类中,数据元素应有较大的相似性,而不同的簇间的元素则应有比较大的差异性。在统计学上,可以通过数学建模去简化数据进行聚类分析找到隐藏的信息,在机器学习中,通过对簇的分析可以找到簇间和簇内的隐藏模式。无监督的学习并不依赖于预先带有标记的任何数据集,只需要通过聚类学习算法来自动的确定数据集的标记和类型。
发明内容
针对上述技术问题,本发明目的是:提供一种基于谱聚类的音频数据聚类方法,与其他音频数据聚类方法不同,本发明以帧频谱图峰值最大处的频率序列方差为横轴、以每帧功率和的序列方差的对数值为纵轴、以功率和的平均值为Z轴,构建音频三维坐标系,得到三维音频向量,根据音频向量间的距离计算音频数据相似度,利用谱聚类方法对音频数据进行聚类。从而达到为海量的音乐自动分类的目的,并且能精准的推荐给不同的用户增强用户体验。
本发明的技术方案是:
一种基于谱聚类的音频数据聚类方法,其特征在于,包括以下步骤:
S01:计算音频数据的音频周期,按照音频周期进行分帧处理,提取音频特征;
S02:以帧频谱图峰值最大处的频率序列方差为横轴、以每帧功率和的序列方差的对数值为纵轴、以功率和的平均值为Z轴,构建音频三维坐标系,得到三维音频向量,然后根据音频向量间的距离计算相似度,得到音频数据的相似度矩阵S;
S03:利用谱聚类方法对音频数据进行聚类。
优选的,所述步骤S01提取音频特征之前还包括:
对每帧音频数据进行傅立叶变换,取幅值最高的频率保存在一个频率序列中,然后对该频率序列进行自相关运算。
优选的,所述步骤S03包括以下步骤:
S11:首先构建拉普拉斯矩阵Lrw=I-D-1S,其中I为单位矩阵,D为对角度矩阵,S为相似度矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城工学院,未经盐城工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610899028.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置