[发明专利]一种基于SVM的音频分类方法及系统在审
申请号: | 201811581291.2 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109766929A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 韦鹏程;姜娇;周震 | 申请(专利权)人: | 重庆第二师范学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/63 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 包晓静 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频分类 特征分析 音频数据 音频特征提取 音频信号特征 结构化信息 分类效果 检索音频 模式识别 时域特性 特征提取 音频分割 音频信号 语义内容 重要手段 自动分类 音频帧 分类 平滑 和频 算法 分析 分割 | ||
1.一种基于SVM的音频分类方法,其特征在于,所述基于SVM的音频分类方法包括:
在音频提取这些特性的方法中,分别使用时域特性和频域特性来提取音频的特性;
在音频分类中,采用基于支持向量机SVM的分类方法进行分类;
在音频分割方法中,采用贝叶斯信息准则BIC的音频分割方法进行分割点确认;其中,音频分割从音频分类的音频流中提取不同音频类别,音频流按时间轴的类别进行划分。
2.如权利要求1所述的基于SVM的音频分类方法,其特征在于,音频提取前,需进行:
音频信号预处理:首先,原始音频信号被预处理,对音频信号进行分割,并对每个音频段进行窗口化和帧化;其次,提取音频帧和音频段,并对提取的特征合并。
3.如权利要求1所述的基于SVM的音频分类方法,其特征在于,在音频提取这些特性的方法中,分别使用时域特性和频域特性来提取音频的特性中,具体包括:
1)音频时间域特性分析和提取:音频时域特性代表时域特性,通过在时域波形的帧中分析音频信号;具体有:
过零率ZCR:在音频信号的离散点上两个相邻采样点的信号值与所有采样数的比值;过零率显示信号过零的频率
其中x(m)是经过处理的离散音频信号;
短期平均能量:短期平均能量为音频特征参数,反映音频能量的变化,这直接关系到窗口长度N的选择;N的值若太长,整个能量的变化相对平稳而差异没有反映出来,但一个窗口太窄则没有光滑的能量函数;选择Haiming窗以在两者之间保持良好的平衡;短期平均能量用下公式计算:
当x(n)表示音频信号的第m个帧中的第n个信号值时,w(n)是窗函数。短时间的能量被设置为一个阈值,在阈值以下,判定为静音;
2)音频域特性分析和提取:计算每个帧的特征值,然后计算出片级的特征值;
3)基于音频片段的特征分析和提取:进行:
静音比例在频域能量中设置一个阈值;
子带能量比平均值由子带能量比参数计算得到音频段特征;
带宽平均值为音频段中每个帧的平均带宽;
进行高过零率计算;
计算音频段中低频能量框架的比值;
频谱转换,描述音频片段中每个相邻音频帧的光谱差异的平均参数;
在音频段的基础音频速率标准方差,计算每个帧的音高频率,然后用这些音调频率参数计算它们的标准偏差;
进行特征向量集的组成向量集划分,划分为24维的MFCC向量,以及由音频片段提取的11维特征向量。
4.如权利要求1所述的基于SVM的音频分类方法,其特征在于,音频分类方法包括:
1)安静和噪音使用基于规则的分类方法;
2)每个音频类别的分类:基于SVM的分类器用于对纯语音/背景声音和音乐/环境声音进行分类。
5.如权利要求1所述的基于SVM的音频分类方法,其特征在于,音频分类方法包括:改进的ΔBIC分割方法,对于每个检测到的BIC窗口,如果检测到一个分裂点,将一个特定的长度滑到下一个窗口;如果分裂点未被检测到,窗的长度也增加,当窗口长度增加到一定程度上,分裂点还没有发现,那么窗口保持当前窗口长度和滑行向前直到找到分割点恢复初始窗口长度;检测到分割点时,窗口的长度直接向后移动。
6.一种实现权利要求1~5任意一项所述基于SVM的音频分类方法的计算机程序。
7.一种终端,其特征在于,所述终端至少搭载权利要求1~5任意一项所述基于SVM的音频分类方法的处理器。
8.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-5任意一项所述的基于SVM的音频分类方法。
9.一种实现权利要求1所述基于SVM的音频分类方法的基于SVM的音频分类控制系统。
10.一种搭载权利要求9所述基于SVM的音频分类控制系统多媒体信息处理设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆第二师范学院,未经重庆第二师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811581291.2/1.html,转载请声明来源钻瓜专利网。