[发明专利]一种基于迭代k-means算法的歌曲聚类方法有效
申请号: | 201811010257.X | 申请日: | 2018-08-31 |
公开(公告)号: | CN109065071B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 戴鑫铉;江春华;龚超;徐若航;刘耀方;王杰 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/63;G06K9/62 |
代理公司: | 成都君合集专利代理事务所(普通合伙) 51228 | 代理人: | 张鸣洁 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means 算法 歌曲 方法 | ||
本发明公开了一种基于迭代k‑means算法的歌曲聚类方法,提取曲库中歌曲的MFCC向量作为声学特征,同时运用迭代k‑means算法对歌曲进行情感识别和情感归类,具体包括以下步骤:提取曲库中歌曲的MFCC,得到每首歌曲的MFCC向量;对所有MFCC向量进行歌曲ID标记并汇整成数据集;对数据集进行第一次k‑means聚类,获得各个MFCC向量聚类结果;根据歌曲所含MFCC向量属于各簇的比例生成K维标签向量集;对所有K维标签向量集进行第二次k‑means聚类,得到最终歌曲聚类结果。本发明可以将曲库中海量歌曲按照歌曲之间人耳感知的情感的相似性进行分类,从而更精准有效的按情感分类为用户推荐相似歌曲。
技术领域
本发明涉及数据处理技术领域,具体的说,是一种基于迭代k-means算法的歌曲聚类方法。
背景技术
当今互联网时代,大型音乐门户网站均拥有海量数据的歌曲库。用户往往有寻找与自己喜爱歌曲类似或者属于同一类别的歌曲的需求。传统搜索引擎只适合在用户对于目标歌曲信息有明确了解的条件下进行搜索,无法根据歌曲之间人耳感知的情感的相似性进行搜索。传统的依靠人工设置音乐标签对音乐进行分类的方法效率低下,不适合针对海量数据的处理,且人工标签准确性较低。因此,现有环境的音乐门户网站缺乏对海量歌曲的进行高效精确归类的方法,导致用户无法根据其余歌曲与自己喜爱歌曲的相似性来方便快速地找寻自己可能感兴趣的歌曲。
授权公告号:CN104077598B;发明创造名称:一种基于语音模糊聚类的情感识别方法的中国发明专利中公开了一种基于语音模糊聚类的情感识别方法,包括:对输入的语音信号进行预处理;提取处理后的语音信号的特征信息(特征信息包括梅尔倒谱系数(MFCC)、基音、共振峰、短时能量);将多类情感进行分组,并根据多类情感分组后的类型分别选取相应的特征信息;根据每一组情感类组合选取的特征信息分别进行分类处理;根据每一组情感类组合分类后的输出结果进行语音情感识别;本发明的有益效果为,通过不同情感选取不同的特征,用改进的自适应模糊K均值聚类方法比传统方式所有情感用同一种特征的FCM方法的识别效果要好很多,并且识别率更高,效果更好。
梅尔频率倒谱系数((Mel-frequency cepstrum coefficients,MFCC)能反映人耳的音高听觉特性,是一种广泛应用于语音处理领域的特征参数。通过将MFCC与其一阶差分、二阶差分结合可以全面反映音乐信号的静态特征和动态特征,提高对音频的识别性能。
k-means算法是一种基于样本间相似性度量的间接聚类方法,属于非监督学习方法。k-means算法接受输入量k,然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其中,聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心或簇中心)来进行计算的。
k-means算法的工作过程为:首先从n个数据对象任意选择k个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的欧式距离判断二者相似度,分别将它们分配给聚类中心所代表的与其最相似的聚类;然后再计算每个所获新聚类的聚类中心,即该聚类中所有对象的均值;不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数。k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
发明内容
本发明的目的在于提供一种基于迭代k-means算法的歌曲聚类方法,基于迭代k-means算法得到MFCC并以MFCC作为声学特征按情感类别对歌曲进行高效精准的聚类,实现曲库中海量歌曲以情感类别自动分类的功能。
本发明通过下述技术方案实现:一种基于迭代k-means算法的歌曲聚类方法,提取曲库中歌曲的MFCC向量作为声学特征,同时运用迭代k-means算法对歌曲进行情感识别和情感归类。
为了更好的实现本发明,进一步地,运用两次迭代k-means算法对歌曲进行情感识别和情感归类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811010257.X/2.html,转载请声明来源钻瓜专利网。