[发明专利]基于支撑向量机的基带时域音频信号分类方法有效
申请号: | 201210125085.7 | 申请日: | 2012-04-25 |
公开(公告)号: | CN102760444A | 公开(公告)日: | 2012-10-31 |
发明(设计)人: | 刘一民;李元新;孟华东 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L19/00;G10L11/00;G10L15/06 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 贾玉健 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于支撑向量机的基带时域音频信号分类方法,首先将基带时域音频信号序列分段,得到初始分段子序列,然后每个初始分段子序列分别减去各自的均值,得零均值分段子序列,接着对每个零均值分段子序列进行加窗处理,将结果分别进行傅里叶变换处理,得到分段子序列的频谱幅度,分别求出每个频谱幅度的标准差得到一个特征量,将各个零均值分段子序列按照次序依次组合成为一个长序列,然后计算出该序列的归一化自相关矩阵,对自相关矩阵进行奇异值分解,得到子空间的分界点,再计算出该基带时域音频信号序列的另一个特征量信噪比参量;最后将两个特征量构成输入向量送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。 | ||
搜索关键词: | 基于 支撑 向量 基带 时域 音频 信号 分类 方法 | ||
【主权项】:
1.基于支撑向量机的基带时域音频信号分类方法,其特征在于,包括如下步骤:步骤一:将总长度为N的基带时域音频信号序列s={s(1),s(2),...,s(N)}分为K段,每段长度为L,得到初始分段子序列s 1 = { s 1 ( 1 ) , s 1 ( 2 ) , . . . , s 1 ( L ) } s 2 = { s 2 ( 1 ) , s 2 ( 2 ) , . . . , s 2 ( L ) } . . . s K = { s K ( 1 ) , s K ( 2 ) , . . . , s K ( L ) } , ]]> 其中si(m)=s((i-1)L+m)(i=1,2,...,K,m=1,2,...,L),然后每个初始分段子序列分别减去各自的均值,可得零均值分段子序列x 1 = { x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( L ) } x 2 = { x 2 ( 1 ) , x 2 ( 2 ) , . . . , x 2 ( L ) } . . . x K = { x K ( 1 ) , x K ( 2 ) , . . . , x K ( L ) } , ]]> 其中x i ( m ) = s i ( m ) - 1 L Σ j = 1 L s i ( j ) ; ]]> 步骤二:对每个零均值分段子序列进行加窗处理,得到结果为x 1 ′ = x 1 w T x 2 ′ = x 2 w T . . . x K ′ = x K w T , ]]> 其中w为汉宁窗;步骤三:对加窗处理后的结果分别进行傅里叶变换处理,得到每个加窗后的零均值分段子序列的频谱幅度序列为f 1 = | FFT ( x 1 ′ ) | = { f 1 ( 1 ) , f 1 ( 2 ) , . . . , f 1 ( M ) } f 2 = | FFT ( x 2 ′ ) | = { f 2 ( 1 ) , f 2 ( 2 ) , . . . , f 2 ( M ) } . . . f K = | FFT ( x K ′ ) | = { f K ( 1 ) , f K ( 2 ) , . . . , f K ( M ) } , ]]> 其中M是频谱幅度序列的长度;步骤四:分别求出每个频谱幅度的标准差d={d(1),d(2),...,d(K)},其中然后求出所有标准差的平均值,得到该基带时域音频信号序列的一个特征量,即频谱幅度标准差步骤五:将各个零均值分段子序列x1,x2,...,xK按照次序依次组合成为一个长序列x,即x={x1,x2,...,xK}={x(1),x(2),...,x(N)},然后计算出该序列的归一化自相关矩阵,结果为其中Q是自相关矩阵的维数,取值范围为[50,90];步骤六:对自相关矩阵R进行奇异值分解,得到R=VΛVH,其中Λ=diag(λ1,λ2,…,λQ)Q×Q=diag(γ1+σ2,…,γp+σ2,σ2,…,σ2)Q×Q,且γ1≥γ2≥…≥γp,从而得到子空间的分界点p;步骤七:根据计算出该基带时域音频信号序列的另一个特征量,记为信噪比参量步骤八:将该基带时域音频信号序列的两个特征量,即频谱幅度标准差D和信噪比参量构成输入向量,送入已经训练过的SVM分类器中,从而鉴别出该基带时域音频信号的种类,区分出语音信号和噪声信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210125085.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种轴承的热处理方法
- 下一篇:跨骑型电动车辆的车辆接近告知装置