[发明专利]一种二次加权的KNN音乐流派分类方法有效
申请号: | 201611054935.3 | 申请日: | 2016-11-25 |
公开(公告)号: | CN106548212B | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 吴梅梅;王永滨;冯爽 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/683 |
代理公司: | 哈尔滨市文洋专利代理事务所(普通合伙) 23210 | 代理人: | 范欣 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种二次加权的KNN音乐流派分类方法,在传统的KNN算法的近邻计算和类属判断两个步骤上进行了加权,分别解决了传统KNN算法认为每个属性的作用都是相同的,忽略其与类别的相关程度的问题和类属判断策略在判断待分类样本类属时仅考虑了每个类别中最近样本数目,而忽略了各类中近邻和待分类样本之间相似性的差异,并将其应用到音乐流派分类工作中。本发明的二次加权的KNN音乐流派分类方法比传统KNN算法在音乐流派分类方面有着更高的分类准确率,并且对与音乐类域的交叉或重叠较多的待分样本集来说,分类效果更佳。 | ||
搜索关键词: | 一种 二次 加权 knn 音乐 流派 分类 方法 | ||
【主权项】:
1.一种二次加权的KNN音乐流派分类方法,其特征在于:该方法的步骤如下:步骤一、音乐描述及特征提取;本步骤总结了音乐流派分类领域中主要的声学特征量,选择了短时能量、短时能量均方值、每秒音符初始数量、节拍速度、高频能量、频谱质心、平整度、梅尔倒谱系数、梅尔倒谱系数差分、过零率、音高、无谐性、音调这13个能充分表征音乐的力度、节奏、音色、音高和音调五大要素的声学特征量,共59维对音乐进行描述,然后使用Mirtoolbox工具包对这些特征量进行提取;步骤二、将数据集用59维特征量矩阵表示;将数据集中的1000首歌曲,每首歌曲都按照步骤一中介绍的特征提取方法提取其59维特征,得到一个59列1000行的特征矩阵;步骤三、使用粗糙集理论计算决策属性对条件属性的属性依赖度k=γp(Q),将k=0的属性去掉,形成特征选择后的特征向量矩阵;在计算近邻的过程中,先计算决策属性对每个条件属性的属性依赖度,如式1所示,然后去掉属性依赖度等于零的特征;
式1中k=γp(Q)为决策属性对条件属性的属性依赖度,其中P为条件属性,Q为决策属性,分母是样本个数,分子表示根据属性P样本集U中一定能归入Q类的样本数目;步骤四、计算未知样本x和每个训练样本yj的距离;根据公式2计算未知样本x和每个训练样本yj的距离;
步骤五、在yj中选择与x距离最小的k个最近邻样本;步骤六、类属判断;类属判断时首先统计k个最临近样本在每个类中出现的次数,如果在次数最大的类中近邻数目超过k值的60%,则直接按照原始KNN的类属判断方法判断类别,如果没有超过60%,则在k出现的所有类中通过样本的加权距离和进行类属判断,如式3,
式3中,Ci为样本的加权距离和,Wi为参与类属判断的各样本权重;步骤七、可扩展性分析;该方法也适用于分布式计算方式,由于公式2对各特征的权重计算是一次性的,每个待分类样本计算距离时不用重复计算,曲库中的样本按计算结点数n平均分为若干子集L1‑Ln分布到各结点上,对每个待分类样本进行计算时,由各结点并行计算,计算过程中选出k个最近邻,各结点的计算结果合并后有k*n个最近邻,再在其中选取k个最近邻用于确定待分类样本的分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611054935.3/,转载请声明来源钻瓜专利网。