[发明专利]一种基于SVM主动学习的音乐情感分类方法在审

申请号：	201810853536.6	申请日：	2018-07-30
公开（公告）号：	CN109189982A	公开（公告）日：	2019-01-11
发明（设计）人：	景路路;姚磊;景学琦	申请（专利权）人：	南京林业大学
主分类号：	G06F16/65	分类号：	G06F16/65;G06K9/62
代理公司：	南京知识律师事务所 32207	代理人：	李吉宽
地址：	210037 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种改进的SVM(支持向量机)主动学习方法，涉及机器学习中的音乐分类与信息处理技术的交叉领域，同时涉及面向大规模训练数据的SVM主动学习分类方法。通过多次迭代方法，把提供给用户信息量最大的样本加入训练集，可以大大减少人工标记样本所耗费的代价。为了评估分类器的性能，实验包含四种音乐情感类别：兴奋的、愤怒的、悲伤的和放松的，对音乐样本进行了分类，并从分类准确率的收敛速度、达到同等准确率下需要标注的样本数目这两个方面，验证了本发明提出的SVM主动学习方法的有效性。
搜索关键词：	主动学习样本音乐情感分类信息处理技术分类准确率用户信息量支持向量机多次迭代机器学习人工标记训练数据音乐分类音乐样本分类器训练集准确率标注收敛验证放松评估改进
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于SVM主动学习的音乐情感分类方法，其特征在于包括以下步骤：步骤1：建立音乐训练样本集X＝{x1…xn},X∈Rd，选取候选样本集合U；步骤2：对音乐样本进行梅尔频率倒谱系数以及基于传统PLP提出的相对谱‑感知线性预测两个特征提取，并对音乐样本集进行建模分类训练；步骤3：从候选样本集U中通过聚类算法选取n个样本并进行先验标注，对应的类别标注为{y1…yn},yi∈{1,‑1}，将先验标注的样本作为初始训练样本集Train，并保证集合Train中至少包含一个正样本和一个负样本，正负样本利用SVM判别函数为g(x)＝ω·Φ(x)+b进行判别，当且仅当对每一个xi，若有yi＝+1，g(x)＞0，若有yi＝‑1，g(x)＜0，令U＝U‑Train，其中，隐式映射Φ：X→F(F为特征空间)，分类面g与参数ω是一一对应的；步骤4：利用SVM算法中的公式12，对先验标注的样本集Train进行训练，得到一个最优分类超平面，即分类选择器；yi[ω·Φ(xi)+b]‑1≥0,i＝1,…,n (12)步骤5：动态构建批量选取的样本集S，并兼顾多样性；5‑1：判断样本集S中的样本个数是否小于m，如果小于m，跳至步骤5‑2，否则跳至步骤6，m为动态批量选取值；5‑2：按照公式12，动态划分可行域，选取最有价值的(xi,yi)；5‑3：根据5‑2的结果集合，按照公式24，对结果集合中的所有样本计算它的Score值，选取Score值最小的样本xs，并执行S＝S∪{xs}，更新S，跳至步骤5‑1；上式前半部分计算了未标注样本xi到当前分类超平面的距离，表示对样本不确定性的判断因素，值越小，表示分类效果越好；上式后半部分是按照我们上文提出的S形成策略，计算未标注样本和S之间角度的余弦值，该角度越大，相应的式子本身求得的余弦值越小，分类效果越好；α在其中则起到了权衡的作用，其取值范围为0到1，若α取值大于0.5则表示更看重样本的不确定性，反之表示着更看重样本的多样性；步骤6：将此高信息含量的样本加入S集合后，对S集合中各个样本点的类别进行人工标注，并且执行Train＝Train∪S，U＝U‑S对样本重新划分，用更新的已标注样本重新训练SVM分类选择器，判断是否满足停止准则，满足则停止迭代，输出训练好的SVM分类器，不满足则重复步骤3至步骤7；步骤7：分类结束。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京林业大学，未经南京林业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810853536.6/，转载请声明来源钻瓜专利网。

上一篇：音频数据扫描方法、装置、存储介质及终端
下一篇：用于学习的语音播放方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于SVM主动学习的音乐情感分类方法在审

专利文献下载